لقد تحدثنا في بداية المحاضرة الماضية حول طريقة ألعاب الطاولة للمحتوى الجيد لهذه البيئة للقيام بالتعلم الآلي والدراسات والذكاء الاصطناعي، وسنتحدث اليوم عن لعبة GO كمسألة تعلم آلي. إذاً، في إشعارٍ خاص إلى أنّ ذلك ما تبدو عليه مسألة تعلم مراقب. إذاً، لدينا مجلس ولاية والذي يحتوي على حزمة من النقاط الحرة، لدى بعضها حجارة بيضاء عليها، وبعض حجارة باخ لديها حجارة سوداء عليها، والغاية من أي لاعب يلزم مكانه هي اكتشاف ما هي الحركة التالية. إذاً، إذا كنت من أفضل المحترفين hoeing boshu Saku فإنّك لقد وجدت أنّ هذه هي الإجابة الصحيحة في موضغ اللوح هذا، إنّي أخمن أنّ العديد منكم لم يكتشف تلك الحركة فعلاً، لكن يمكننا أن نفكر بها بهذه الطريقة، صحيح؟ إذاً يمكننا أن نأخذ كل موضع لوح وتمثيله كشعاع. إذاً، تحتوي النقطة 1 1 على 0 لأنّه لا يوجد أي حجارة عليها، وربما لدى الموضع التالي حجارة بيضاء عليه، ومن ثمّ حجارة سوداء. إذاً يمكننا أن نأخذ ذلك، ونقول أنّ الحجارة البيضاء هي 1 والحجارة السوداء هي ناقص 1 وثمّ تسجيل النقاط 361 كلها كالشعاع الطويل هذا من الأصفار والواحدات، والواحدات السالبة والآن بالنظر إلى تلك القائمة، نريد برنامج يأخذ ذلك كمدخل ونتائج الحركة التالية لنقوم بها. إذاً يمكننا أن نرى علاقة مدخل-نتيجة هذه والتي ذكرتها سابقاً في البداية. الآن، لقد كانت GO صعبة لفترة لأنّ البشر يميلون للتفكير بها كما يسميها methane بالأشكال والأمثال. إذاً نرى الشكل هنا يدعى عقدة الخيزران ويقول المثل أنّ عقدة الخيزران هي شكل قوي بشكلٍ مشابه لشكل بانوتشي هذا. ذلك مسجل أدناه أنّه معوف بهذا الشكل القوي جداً. ذلك جيد إذا كان يمكنك صنعه، أو يمكن أن يكون لدينا أمثال ترتبط بكيف يجب أن تتحرك كالعسل على رأسين من الحجارة، لكن عندئذٍ لدينا أيضاً المزيد من الأمثلة المتوسطة هذه كنقاط العدو هي نقاطك. مما يعني أنّه إن كان خصمك يريد الذهاب إلى مكانٍ ما، فإنّ ذلك على الأرجح فكرة جيدة لك لتفكر بتلك النقطة بنفسك، أو عندئذٍ الأمثال المتوسطة هذه مثل، لا تثق بالأمثال بشكلٍ أعمى. وإذاً، ما قد نريد أن نأخذه هو هذه الأنواع من الأفكار وترميزهم لبرنامج حاسوبي، يمكن تخيله، حيث إنّه من الصعب جداً كتابة خط من الرموز الذي يقول لا تتبع الأمثال بشكلٍ أعمى، وبشكلٍ مشابه يفكر لاعبين لعبة GO حول مفهوم الـ OG هذا كثيراً، والذي يتحول بشكلٍ حر إلى خطر. إذاً، موضع اللوح قد يكون جيداً على المدى القصير، لكنه يترك الكثير من OG. إذاً، يترك الكثير منكم مكشوفين للخطر ولذلك GO هي حول موازنة و اكتساب النقاط الآن ، مقابل التأكد من موضعك أنّه ليس ضعيفاً جداً. وهذه الأنواع من الأفكار هي ما نحتاجه من الحاسوب أن يقوم بها إذا احتاج أن يلعب GO بشكلٍ فعّال. إذاً نحتاج خورازمية تعلم مراقب نوعاً ما، والتي يمكنها نوعاً ما أن تأخذ هذه المبادئ وتحولها إلى لعبة فعالة، لكن عندئذٍ، فقد يكون ترميز هؤلاء بشكلٍ مباشر صعباً جداً وهو صعبٌ جداً. إذاً، إنّ السؤال المطلق نوعاً ما لبرنامج GO للعب الآلي هو كـ.. حسناً، لدينا هذا اللوح الفارغ، كيف ألعب و أفوز أو بالعكس إن كنت أبيض، كيف أدافع ضد ذلك الأسود وأفوز. إذاً إنّ تلك فكرة عالية المستوى نوعاً ما، في كل حركة نرغب باتخاذها، يقوم هذا الشعاع بترميز موضع اللوح وينتج الحركة التالية التي يجب القيام بها.