إذاً، في آخر مرة قد كنّا هنا قد قام Artemy

بإنهاء المناقشة في

تقديم بداية التعلم

الآلي، وما سنتحدث عنه اليوم

خلال عدة المحاضرات التالية،

هو دراسة حالة في التعلم الآلي

مطبّقة على نظام محدد.

إذاً، لدى ألعاب الطاولة تاريخ طويل

مع الذكاء الاصطناعي يعود للخمسينيات،

ولقد كانوا يستخدموا نوعاً ما لتحفيز

التطورات الأولية والتعلم

الاصطناعي والذكاء الآلي.

إذاً لماذا ذلك؟ لماذا نهتم بألعاب الطاولة؟

حسناً، من ناحية أولى، ألعاب الطاولة

هم هذا النظام المعزول جداً، حيث

نعلم ماذا يعني أن تفوز، نعلم ماهي

كل الحركات، وإنّنا نعلم نوعاً ما

عواقب هذه الإجراءات،

على عكس العالم الحقيقي، حيث تكون الأمور

معقدة جداً وفوضوية،

والناس تتغير، والأوقات تتغير

ولذلك إنّه من الصعب امتلاك

نظام تكرار دقيق، بينما في ألعاب

الطاولة، فإنّ قواعد الشطرنج قد كانت

نفسها لمئات السنين، لكن ألعاب

الطاولة أيضاً قد كانت مقياساً

لما يفكر به الناس كشخص ذكي

سواءً كان هذا صحيحاً أو لا.

نستطيع أن نرى أنّ هناك الكثير من الميزات

لألعاب الطاولة الذي كانت حديثة للعالم،

وبشكلٍ خاص في هذا المقال،

لكن يمكننا أن نرى من مجلة byte

في عام 1978 هذه الميزات والتي هي

مهمة جداً للعب ألعاب الطاولة. إذاً، تحتاج

أن تخطط خطة استراتيجية لتكتشف أي

حركات سوف تقوم بها، وكيف

تنفذها، تحتاج أن تخطط إلى الأمام

لتكتشف ماهي غاياتك سواءً كانت

قصيرة الأمد أوطويلة الأمد، ومن ثمّ

تحتاج أن تكون قادراً على حساب

كيف ستلعب هذه الحركات لكي

تنفذ خطة جيدة. إذاً، يمكن أن نرى أنّه،

بينما قد تكون هذه الميزات

بطرقها المحددة الخاصة، هناك بالفعل

نفس نوع الأشياء التي

نقوم بها في أنظمة العالم الحقيقي.

تحديد ألعاب الطاولة مكان مثالي للبدء بمحاولة

التفكير حول كيفية جعل الآلات تقوم

بأشياء تبدو وكأنهم

حاسوب ذكي. لقد كان العلماء

يبنون آلات ليلعبوا ألعاب

الطاولة، الآن ومنذ وقتٍ طويلٍ أيضاً.

إذاً بالعودة إلى عام 1952

قد تمكنت الآلة oxo Pam من لعب

لعبة مثالية من tic-tac-toe (إكس-أو)

بالتقدم إلى عام 1995، لقد أصبح حاسوب

Chinook بطل العالم في لعبة الداما.

لقد أصبح Chinook التقني الآن

المتفوّق بطريقة تستطيع أن تتفوق بها الحواسيب

والتي هي أنّ البشر فانيين.

وفي المقبل، فإنّ أفضل إنسان لاعب في لعبة الداما

هو اللاعب Marian Tinsley الذي

توفي في منتصف مباراتهم،و ولقد كان

Marian Tinsley أفضل بكثير من

أي لاعب آخر،

بحيث أصبح Chinook فجأةً

بطل العالم، لكن لن نعلم أبداً

إن كان Chinook أفضل.

الكثير منكم قد سمع أنّ الأزرق القاتم قد غلب

غاري كاسباروفا (الذي هو بطل العالم في الشرنج في الوقت الحالي) 
في عام 1997

إذاً، نرى أنّه

في عام 1952 لعبة tic-tac-toe (إكس-أو) 
وثم في عام 1995

لقد هُزِم في لعبة الداما، ومن ثمّ في عام 1997 الشطرنج.

لقد أصبح الحاسوب بطل العالم.

إذاً عام 1998، كيف كانت الحواسيب تقوم بلعبة GO،

حسناً، إذا رأيت هذا اللوح هنا،

قد لا تعلم كيف هي القواعد.

لقد تسني للحاسوب أن يلعب 30 حركة

في بداية اللعبة ومع ذلك خسر

لإنسانٍ بسيط، ليس لأفضل

إنسانٍ حتى. إذاً يمكنك أن ترى أنّ الطريقة

التي عليها الحواسيب. أفضل لاعب على الإطلاق

في الشطرنج لكن ومع هذا لقد احتاج 30 حركة

على الأقل في بداية لعبة GO

لكي يهزم أفضل البشر. إذاً، الآن ،

دعونا نأخذ دقيقة لنتحدث عن

قواعد لعبة GO، وسنتحدث عن

كيفية عملها. إذاً أولاً دعونا نتحدث عن

التاريخ، إذاً لعبة GO هي لعبة منتشرة عالمياً

لكن خاصةً في شرق آسيا، وهناك

أكثر من 30 مليون لاعب في كل مكان

في العالم، وفي الواقع، هناك بين

أربعة وستة بطولات كل سنة، والتي

لديها فائزين بجوائز أكثر من

مليون دولار. يتراوح عمر لعبة GO بين 2500

و4000 عام، وفي الواقع، بعض

أقدم النصوص التي لدينا حول لعبة GO

هي من كتابة كونفوشيوس. إذاً لدى لعبة GO

تاريخ طويل جداً أيضاً. حسناً، إذاً لعبة GO

بالتحديد هي لعبة تتضمن لاعبين اثنين،

إذاً هناك لاعبين،

لكنها حتمية أيضاً، ما يعني

أنّه ليس هناك عشوائية. إذاً إذا لعبت

شيئاً ما مثل البوكر، فإنّك لا تعلم أي

ورقة لعب ستسحب عندما تسحب

ورقات لعب، بينما في لعبة GO تلعب حركة

وذلك هو الأمر فحسب.

وإنّها أيضاً لعبة معلومات

مثالية والذي يعني أنّ

كلا اللاعبَين يعلمان كل شيءٍ يجري.

إذاً، يمكنك أن تتخيل أيضاً لعبة

عن حرب حيث هناك تشويش الحرب،

لذلك قد يكون لديك بعض الأسلحة لكني لا أعلم

أين هي هذه الأسلحة. وإذاً ليس

وكأنّ كل شخص يعلم كل شيء

في لعبة GO، مما يجعلها نظام جيد

جداً للتعلم الآلي لأنّه ليس

لدينا أي معلومات مخفية.

إذاً، الطريقة التي تعمل بها هي أنّني قلت أنّ هناك

لاعبَين، أبيض وأسود وإنّهم

يتناوبون الحركات، اللوح عبارة عن

19×19 نقطة، ويتناوب اللاعبان

اللعب على نقاط التقاطع.

الفكرة التالية هي فكرة الالتقاط هذه.

إن كان لديك مجموعة من الحجارة المتصلة

بواسطة نقاط،

وطوّقوا بحجارة من اللون الآخر

بشكلٍ كامل، تُزال هذه الحجارة

من اللوح، الآن، يلعب الأبيض والأسود

ذهاباً وإياباً، تخلع الحجارة

إن كان هناك ضرورة، إذا تم التقاطهم،

وفي نهاية اللعبة نرى أخيراً

من منطقته مُحاطة أكثر.

وإذاً، ما نفعله هو أنّنا نحسب المنطقة

المحاطة بكلا اللاعبَين، ومن ثمّ

نحسب عدد الحجارة التي

التقطتها، ويفوز من لديه النقاط

الأكثر أياً كان. إذاً، هذه ليست

جميع القواعد للعبة GO، لكنها تقريباً كل القواعد

للبداء، ونأمل أنّنا سنعطيكم

بما فيه الكفاية، لنتقدم لنعطيكم

بعض المعنى لكيفية لعب اللعبة.

إذاً بالعودة إلى الحاسوب GO، كما ذكرت

سابقاً في 1998، لقد كانت الحواسيب

تعمل بشكلٍ رديئٍ جداً، وثمّ حوالي عام 2000

حزنا أخيراً على أحد أول

اختراقاتنا والتي كانت talk later

لكن في عام 2004، لقد خسر حاسوبٌ

لمحترف مع عجز بتسعة حجارة

والذي لا يزال عجزٌ كبير، لكن

إنّه أقل بكثير من عجز 30 حجرة،

ومن ثمّ بعام 2010 لقد أنقصنا

حجرين آخرين. إذاً، لقد هزم حاسوبٌ

محترفاً مع عجز سبعة حجارة،

ومن ثمّ بعد خمسة أعوام

لاحقاً في عام 2015 لقد هزم حاسوبٌ

محترفاً مع عجز خمسة حجرات.

إذاً، منذ عام 2004 وحتى 2015. إذاً، على امتداد

إحدى عشر عاماً، لقد أنقصنا عجز أربعة نجمات.

بعد عدة شهور، في آذار عام 2016

لقد هزم هذا البرنامج alphago ليسا دول

والتي تعتبر من أفضل المحترفين

في هذا الوقت، بعجز صفر حجارة.

إذاً، لقد تتطلب منا 11 عاماً للنقص أربعة

حجارة، ومن ثمّ بحوالي ثلاثة أشهر

لقد ذهب من خمسة حجارة إلى هزيمة أحد

أفضل المحترفين، ومن ثمّ

بعد عد شهور، لقد هزمت النسخة الثانية من

برنامج alphago master أفضل

المدربين المحترفين بنتيجة ثلاثة بمقابل لاشيء.

إذاً، لم يخسر الحاسوب حتى، in qje

ولقد كان أحد أفضل اللاعبين في هذا الوقت

ومن ثمّ قبل عدة شهور مؤخراً

لقد صدر alphago zero وهزم

نسخة alphago master بنتيجة 89

مقابل 11. إذاً لقد تتطلب منّا إحدى عشر عاماً

لنكسر أربعة حجارة، لكن الآن في العام

والنصف الماضي، لقد نجحنا بالإعجاب

بهزيمة أفضل اللاعبين، وثمّ هزيمة

البرامج التي هزمت أفضل اللاعبين.

إذاً، لقد حزنا على هذا المستوى الرائع

من التقدم.