شاهد روبرت، الذكاء الاصطناعي، يتعلم كيفية لعب Super Mario Live على TikTok

على تيك توك، بين مقاطع الفيديو “استعد معي”، والحيل الحياتية، والميمات، يعمل عدد قليل من الروبوتات على التحدي الذي واجهه الكثير منا في مرحلة ما من حياتنا: الضرب سوبر ماريو العالم. خلال الأسبوع الماضي، كان المستخدمون البث المباشر ان الذكاء الاصطناعي يحاول تعلم العزف على ماريو، ومن أجل روبوت واحد على وجه الخصوص، الأمر يسير على ما يرام. اسمه روبرت، وقد تجاوز المستوى الثاني للتو.

ستكون استراتيجية الذكاء الاصطناعي مألوفة لأي شخص يتذكر أول مرة استخدم فيها وحدة تحكم Super Nintendo. يركض روبرت، ويقفز، ويصطدم بالأعداء، ويسقط من المنحدرات، ويموت – مرارًا وتكرارًا. وفي كل مرة يموت، روبرت يحاول مرة أخرى. عادةً ما يقوم بنفس الحركات التي قتلته في الجولة الأخيرة تقريبًا. ولكن إذا شاهدت لفترة كافية، ستلاحظ أن روبرت يتطور يتحسن. هو – هي’التعلم.

قال Join The PCMasterRace، مستخدم TikTok المسؤول عن روبرت، والذي طلب عدم استخدام اسمه الحقيقي: “إنه برنامج تم تصميمه لمحاكاة الانتقاء الطبيعي باستخدام الشبكات العصبية”. (PCMasterRace هو الاسم المرفوض لأحد المنتديات الفرعية المتعلقة بأجهزة الكمبيوتر المكتبية.)

بمعنى آخر، روبرت هو نظام من خوارزميات التعلم الآلي التي تتحسن من خلال مراقبة أخطائها. لدى روبرت هدف محدد: الوصول إلى الطرف الآخر من المستوى. إنه يعرف الأزرار التي يمكنه الضغط عليها ويمكنه رؤية ما يحدث على الشاشة. (يمكنك في الواقع رؤية ما “يراه روبرت”.s” في الجزء العلوي الأيسر من الفيديو أدناه.) ولكن على عكس مشغل ماريو البشري، لا يمكن للذكاء الاصطناعي أن يفترض فقط أنه يجب عليه تجنب Koopas أو محاولة عدم السقوط من الحافة. كل ما لدى روبرت هو ردود فعل إيجابية وسلبية. في الأساس، يحاول روبرت الأمور بشكل عشوائي. فهو يتذكر ما نجح وما لم ينجح، وتتحسن استراتيجيته بمرور الوقت.

روبرت هو تم تصميمه على غرار التطور بمعنى أنه يعمل باستخدام “الأنواع” و”الأجيال”. يحاول الذكاء الاصطناعي اتباع استراتيجية معينة لكل نوع، والتي تستمر من جولتين إلى ستة جولات. ومن بين كل 50 إلى 100 نوع، يجمع الذكاء الاصطناعي ما تعلمه في “جيل”.

أثناء لعب الذكاء الاصطناعي، فإنه يحصل على درجة “اللياقة البدنية”. ترتفع اللياقة البدنية بناءً على مدى المسافة ماريو يصل إلى اليمين وكان أسرع يصل إلى هناك. يتم اختيار الأجيال ذات اللياقة الأعلى ليتم “تربيتها” للأجيال القادمة، مما يعني أن الذكاء الاصطناعي يعتمد على السلوك والأنماط التي نجحت وبدأت من جديد. وهذا يسمح لعملية اتخاذ القرار بأن تصبح أكثر تعقيدًا وتعقيدًا بمرور الوقت.

إنها تسير ببطء، لكنها تعمل. استغرق روبرت 57 جيلًا فقط للتغلب على المستوى الأول، مما أثار الاحتفال في التعليقات بينما ابتهج المشاهدون بنجاح روبرت.

تم تسمية روبرت، جنبًا إلى جنب مع لاعب AI Mario آخر يبث TikTok، بمودة جورج، يقوم بتشغيل برنامج مفتوح المصدر يسمى MarI/O. تم بناؤه بواسطة المبرمج والمذيع المباشر سيث هندريكسون سيث بلينج متصل. MarI/O ليس جديدًا. أطلقه هندريكسون منذ سنوات مضت، لكن مكائد الروبوت لها أهمية متجددة في عصر تريدنا فيه صناعة التكنولوجيا أن نعتقد أن الذكاء الاصطناعي سيتولى المسؤولية قريبًا العالم.

يعد MarI/O أكثر تبسيطًا بكثير من نظام مثل ChatGPT، ولكنه نافذة على كيفية القيام بذلك نماذج الذكاء الاصطناعي عمل. أدوات الذكاء الاصطناعي هذه ترمي السباغيتي على الحائط، ويصمم البشر أنظمة لإخبارهم ما إذا كانت هذه المحاولة أفضل أم أسوأ من المحاولة الأخيرة. ومع مرور الوقت، تتحسن المحاولات. الآن تخيل أن هذا يحدث ملايين أو مليارات المرات. يمكنك مشاهدة شرح أكثر تفصيلاً في أحد مقاطع فيديو هندريكسون:

MarI/O – التعلم الآلي لألعاب الفيديو

مع ChatGPT، الأمر أكثر تعقيدًا بشكل كبير. ليس لدى MarI/O العديد من الخيارات: يسار، يمين، أعلى، أسفل، A، B، X، و Y. من ناحية أخرى، تحتوي اللغة الإنجليزية على مئات الآلاف من الكلمات، وعدد لا يحصى من الطرق ترتيب تلك الكلمات، وعدد لا حصر له من الناحية النظرية من الأفكار. MarI/O أبسط بكثير من ChatGPT—والتقنية مختلفة جذريًا — لكن إذا فهمت كيفية عمل MarI/O، يمكنك استقراء ذلك من أجل فهم مفيد لتقنية chatbot.

روبرت، للأسف، مجرد رجل صغير. إنها تبذل قصارى جهدها، لكن روبرت سيواجه مشكلة عندما يتقدم في اللعبة. يكافئ نظام MarI/O نفسه فقط بناءً على مدى وصول ماريو إلى يمين الشاشة، ولكن في بعض المستويات في عالم Super Mario، يتعين عليك الصعود للوصول إلى الهدف، بدلاً من الذهاب إلى اليمين.

قال انضم إلى PCMasterRace: “ومع ذلك، فإنني أخطط لتعديله حتى يتمكن من تسلق الهياكل الرأسية بشكل أفضل”.


اكتشاف المزيد من موقع دبليو 6 دبليو

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع دبليو 6 دبليو

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading