لقد فكرنا أن نتحدث في هذا القسم عن مفهوم متقدم وهو الطرق التي ساعد التعلم الآلي فيها على تحسين الخوارزميات التقليدية وخاصةً خوارزمية ذات حمولة 20 المكدسة هذه، وهي عمل قد قمت به في بحثي. إذاً، دعونا نتخيل أنّنا نريد أن نجد شيئاً ما يدعى القيمة المتوقعة لدالة، ذلك إذا كانوا يعملون تحت شروط مختلفة في الكثير من الأنظمة، ونريد أن نعلم كيف يتصرف النظام في المتوسط، وطريقة واحدة لاكتشاف المتوسط هذا هي القيام بشيءٍ ما يدعى إجراء مونتي كارلو وإن كنت تتذكر من سابقاً خلال قسم GO ، لقد تحدثنا عن بحث شجرة مونتي كارلو، نفس القكرة هنا. إذاً، دعونا نقول أنّ لدينا نرد، ونريد أن نكتشف أي رقم نتوقع أن نحصل عليه في المتوسط، ترجيح كل عدد وفقاً لقيمته. إذاً، ما يمكننا فعله هو أنّنا يمكننا أن ندحرج النرد مرات كثيرة، ربما نحصل على 2 في أول مرة ثمّ نحصل على 6، وثمّ نحصل على 2 مرة أخرى، وثمّ 3، ونستمر بدحرجته، وربما تجد أنّ قيمة المتوسط هي 3.4، الآن، قيمة المتوسط الصحيحة للنرد هي 3.5 إذاً، لم نحصل على العدد بشكلٍ دقيق، لكننا اقتربنا جداً. الآن، يُستخدم هذا أيضاً لأنظمة أخرى، إذاً، كمثال، دعونا نقول أنّ لدينا طائرة، ونريد أن نعلم متوسط السحب على هذه الطائرة. الآن، الطائرات مضبوطة بشكلٍ ممتاز للتتصرف بشكلً جيد تحت مختلف الشروط، لذلك ربما عندما طيّرنا طائرتنا أربع مرات، وجدنا قيم السحب، إذا قلنا 8.16 ، 8.1 ، 8.14 ومن ثمّ ربما 8.15 نجد أنّ قيم المتوسط هي حول 8.14 ، الآن، يمكنك أن تتخيل أولاً أنّه من المكلف جداً أن تطير طائرة. وإذاً نريد أن نجد هذه القيمة المتوقعة، هذا الأداء المتوقع، باستخدام بضع رحلات طيران قدر الإمكان، لأنّ كل رحلة طيران مكلفة جداً. الفكرة الرئيسية الأخرى هنا هي أن تلاحظ أنّه على الرغم من أنّه بمثال النرد ذلك، لقد وجدنا أنّه بعدّة دحرجات، لقد حصلنا على خطأ كبير جداً بينما في مثال الطائرة، بعد عدّة رحلات طيران، لقد كان خطئنا صغيراً جداً، وذلك لأنّ أرقام النرد تتفاوت كلها من 1 إلى 6، بينما في مثال أداء الطائرة هذا، هناك قيم مقتربة من بعضها البعض أكثر بكثير 8.16 ، 8.14 إذاً، المفهوم الرئيسي مونتي كارلو، هو أنّ كلما استطاعت محاكاتك أن تتفاوت أكثر، كلما كان الخطأ الذي يمكن أن تحصل عليه أكبر. وبالتالي سيءٌ في توقع القيمة المتوقعة. إذاً، كيف يعمل هذا؟ لدينا على الطائرة الكثير من المحسسات التي تقيس ما الأوضاع التي كانت عندما حدثت رحلة الطيران. إذاً، لا نعلم قيمة السحب فحسب، كمثال، ربما نعلم أيضاً عدد ماخ (قياس سرعة الهواء) الذي كانت الطائرة تطير عنده، وهو مدى سرعة طيران الطائرة متناسبة مع سرعة الصوت. وإذاً، ما لدينا هو علاقة المدخل-الناتج هذه، حيث المدخل هو مدى السرعة التي نطير بها، والناتج هو سحب الطائرة، ومجدداً، نريد أن نعلم متوسط السحب خلال مجموعة من رحلات الطيران، إذاً كمثال، نحن نعلم كم تحتاج الطائرة من وقود. وإذاً على اليمين هنا، نرى رسم بياني، حيث محور x لديه عدد ماخ الذي نطير عنده. محور y هو قيمة ذلك السحب، ولنقل أنّ الخط الأزرق هو القيمة الصحيحة للسحب. aught رقم ماخ ذلك الآن، في الواقع كيفية تصرف الطائرة ليست كهذه. إذاً، لا تبدأ وتستخدم هذه لتصاميمك، لكنها تعطينا هذا الحدس، حيث ما يمكننا فعله هو أخذ بيانات رقم ماخ المدخل تلك وتعلم ما هو السحب، كدالة لبيانات المدخل تلك، الآن، ربما نأتي بهذا الخط المنقط الأخضر، الموجود في الصورة. الآن، نرى أنّه ليس متطابق تماماً، إنّ ليس متناسب تماماً لكمية السحب الموجودة، لكن نرى أنّه يقوم بعملٍ جيد جداً، حتى لو كان لدينا رقم صغير فقط من العينات. حسناً. إذاً، الآن، المفهوم الرئيسي هو ما يمكننا فعله هو أنّه يمكننا أن نأخذ هذين الخطّين ونطرحهم من بعضهم البعض. وإذاً، نحصل الآن على هذا الشيء الجديد، وما ندعوه بالسطح المنظّم حيث لدينا سلوك حقيقي، عندما نزيل التأثيرات، التي يمكن أن نتعلمها بشكلٍ جيد جداً. وإذاً، ما لدينا الآن هو هذا الخط الأحمر في الأسفل، ذلك هو الإختلاف بين استنتاجنا الصحيح وقيمتنا المكتسبة بالتعلم الآلي. والآن نستطيع أن نطبق مونتي كارلو على هذا الشيء هنا، وإن كنت تتذكر لدى مونتي كارلو خطأ كبير جداً، عندما تتغير الأعداد بواسطة الكثير، لكن من خلال جلب هذا السطح المكتسب بالتعلم الآلي. الدالة الآن أملس بكثير، والالتواءات ليست بهذا الكبر. ولذلك سينزل خطئنا المتوقع كثيراً نحواً ما، فقط لأنّنا قللنا ما ندعوه باختلاف الدالة. كم مرة تتذبذب الدالة هنا وهناك، وإذاً، إن كنت ستصفح عن الشريحة التقنية الوحيدة، يرينا محور x هنا، كم من العينات لدينا، كم مرة طيّرنا طائرتنا، ومحور y لديه تقديرنا تقريباً بالنظر إلى عدد العينات في المتوسط. إذاً، لتوليد الرسم البياني هذا، إنّي أجري هذا الإجراء المثالي نوعاً ما، عدد كثيراً من المرات لأرى مدى فعالية عمله . الآن، ما نراه هو أنّه بالنسبة لكل هذه الخطوط، ينزل الخطأ عندما نحصل على عينات أكثر، صحيح؟ ذلك يبدو منطقياً، كلما كان لدينا نقاط بيانات أكثر، كلما كان ما سنفعله أفضل، لكن ما يخبرنا هذا أيضاً، أنّ الخط الأخضر لقد كان... إذا استخدمنا مونتي كاررلو فقط، لقد أخذنا قيمتي متوسط فقط، كما فعلنا مع النرد. يُظهر الخط الأحمر ما إذا استخدمنا بيانات التعلم الآلي فقط. إذاً، كنا قد أخذنا عيناتنا متناسبة مع التعلم الآلي، ورأينا الأداء المتوسط للتعلم الآلي، وعندئذٍ، يُظهر الخط الأزرق هذا الإجراء الذي أخبرتكم عنه، حيث ندمج هذين الشيئين معاً، ونحصل على سطح مونتي كارلو المختلف هذا، وذلك الخط الأزرق، حيث دمجنا الاثنين، ونرى ذلك لكل أعداد العينات. إذاً، مهما كان لدينا من نقاط البيانات، فإنّ تقدير مونتي كارلو المكدس لديه خطأ أدنى. إذاً ما رأيناه هنا أنّنا أخذنا مونتي كارلو، تقنية اُختُرِعَت خلال مشروع مانهاتن في أربعينيات القرن الماضي، لكن باستخدام التعلّم الآلي، لقد كنّا قادرين على تعزيز هذه الفكرة البسيطة، وخفض الخطأ، والحالة، على سبيل المثال، خفض عدد رحلات طيران الطائرة، سنحتاج أن نحصل على تقدير جيد بما فيه الكفاية، من السحب. إذاً، عُدْ عدّة محاضرات للوراء، للعب الحاسوب للعبة الغو، يمكننا أن نرى فعلاً أنّ هذه الفكرة نوعاً ما مرتبطة ببرنامج ألفا GO ، وكيف كان قادراً على أن يكون فعّالاً جداً. إذاً، لقد كان لديهم في ألفا GO بحث شجرة مونتي كارلو هذا، حيث لعبوا ألعاب عشوائية، لقياس احتمالية الفوز، لم يكن ذلك الشيء الوحيد الذي فعلوه، لقد زادوا احتمالية تكيّف الفوز بما دعوناه بقيمة الدالة، والتي استنتجت كم كان الموضع المُعطى جيداً. وإذاً من خلال دمج هاتين الفكرتين، لقد نظّموا مونتي كارلو، وجعلوا تقدير الفوز دقيقاً أكثر من طريقة أخرى. إذاً يتضمن درسنا هذا، شكراً لكم للانضمام لي، وآمل أنكم كسبتم نظرة عامة عالية المتسوى من التعلم الآلي. حسناً، والآن لنتعلم طريقة إضافية أخرى رائعة لتتعلم أكثر، انظر إلى مواد إضافية، حيث ضمّنا معلوماتٍ أكثر عن المواضيع التي ناقشناها، نأمل أنكم استمتعتم هذه الدروس، ونأمل أنّكم متلهفين للتعلموا أكثر، شكراً لكم.