جنرال لواء

تتعلم الروبوتات بسرعة لاستكشاف العالم مثل البشر


عرض الفنان للخوارزمية في العمل MIT News

كل يوم ، يتخذ الإنسان العادي آلاف الخيارات - خاصةً عندما يتعلق الأمر بمكان الذهاب وكيفية الوصول إليه. يعمل باحثون من معهد ماساتشوستس للتكنولوجيا على مساعدة الروبوتات في اجتياز نفس الخيارات في التنقل.

يساعد نموذج تخطيط الحركة الجديد والشبكة العصبية الروبوتات على معرفة كيفية الوصول إلى هدفهم النهائي من خلال استيعاب المزيد من بيئتهم. تنشئ الخوارزمية "شجرة" من القرارات المحتملة التي تحافظ على التفرع حتى يجد الروبوت المسار الأمثل للتنقل.

قد يعني هذا أن روبوتات المستقبل لن تضطر إلى استخدام نفس القدر من القوة الحاسوبية ويمكن أن تصل إلينا حيث نريد أسرع وأكثر أمانًا من ذي قبل. تم تقديم ورقة تفصيلية عن الخوارزمية الجديدة في المؤتمر الدولي IEEE / RSJ حول الروبوتات والأنظمة الذكية.

إصلاح الطرق القديمة للملاحة الآلية

توقفت الخوارزميات القديمة عند منهجية الفرع. لم يساعدوا الروبوت أبدًا في "التعلم" من أخطائه. كما أنهم لا يتذكرون كيف تصرفوا في الحالات السابقة في بيئات مماثلة. هذه "الذاكرة قصيرة المدى" هي ما أراد فريق معهد ماساتشوستس للتكنولوجيا إصلاحه.

"مثلما هو الحال عند لعب الشطرنج ، تتفرع هذه القرارات إلى أن تجد [الروبوتات] طريقة جيدة للتنقل. ولكن على عكس لاعبي الشطرنج ، فإن [الروبوتات] تستكشف كيف يبدو المستقبل دون تعلم الكثير عن بيئتها والعوامل الأخرى "، كما يقول المؤلف المشارك أندريه باربو ، وهو باحث في مختبر علوم الكمبيوتر والذكاء الاصطناعي (CSAIL) التابع لمعهد ماساتشوستس للتكنولوجيا ومركز العقول والعقول والآلات (CBMM) داخل معهد ماكغفرن بمعهد ماساتشوستس للتكنولوجيا.

وتابع: "المرة الألف التي يمرون فيها مع نفس الحشد معقدة مثل المرة الأولى. إنهم دائمًا يستكشفون ، ونادرًا ما يراقبون ، ولا يستخدمون أبدًا ما حدث في الماضي".

هذا هو المكان الذي تلعب فيه الشبكة العصبية للفريق. تسمح الشبكة للنظام بتوجيه الروبوت عبر البيئات المزدحمة أو الصعبة ثم تواصل تطبيق تلك الاستراتيجيات في مواقف أخرى.

يقول Yen-Ling Kuo ، "عندما يتفاعل البشر مع العالم ، نرى كائنًا تفاعلنا معه من قبل ، أو في مكان ما كنا فيه من قبل ، لذلك نعرف كيف سنتصرف" طالب دكتوراه في CSAIL والمؤلف الأول على الورقة. "الفكرة من هذا العمل هي إضافة نموذج للتعلم الآلي إلى مساحة البحث يعرف من التجربة السابقة كيفية جعل التخطيط أكثر كفاءة."

تعليم توجيهات الروبوت

كان على الباحثين اكتشاف طريقة لاختبار نموذجهم الجديد. لقد احتاجوا إلى بناء بيئة تعلم النموذج أن يتعلم. قال باربو: "عندما تكون عالقًا في بيئة ، وترى مدخلًا ، ربما تكون فكرة جيدة أن تمر عبر الباب للخروج".

طوروا محاكاة تُعرف باسم "مصيدة الحشرات" حيث كان على الروبوت ثنائي الأبعاد الهروب من غرفة داخلية عبر قناة ضيقة تؤدي إلى غرفة أكبر. بمجرد هروب الروبوت ثنائي الأبعاد في المرة الأولى ، قدم الفريق له مصيدة أخرى.

ثم قاموا بتقديم النموذج لعناصر متحركة متعددة مثل تقاطع حركة المرور أو شارع مزدحم. في هذا المثال بالذات ، استخدم الباحثون دوارًا - وهو شيء ما زالت حتى أفضل السيارات ذاتية القيادة تكافح في أوقات الازدحام المروري.

يقول باربو: "المواقف مثل الدوارات صعبة ، لأنها تتطلب التفكير في كيفية استجابة الآخرين لأفعالك ، وكيف ستستجيب بعد ذلك لأفعالهم ، وما الذي سيفعلونه بعد ذلك ، وما إلى ذلك". "تكتشف في النهاية أن الإجراء الأول كان خاطئًا ، لأنه سيؤدي لاحقًا إلى وقوع حادث محتمل. تزداد هذه المشكلة سوءًا بشكل كبير كلما زاد عدد السيارات التي يتعين عليك مواجهتها ".

أوضح الباحثون أن النموذج تعلم كيفية التعامل مع ما كانت تفعله السيارات الأخرى بنفس الطريقة التي يفعل بها أي إنسان. في حين أنه من المرعب التفكير في الروبوتات الشبيهة بـ Terminator التي تتمتع بهذا التنقل عالي القدرة ، يقول الباحثون إن التطبيقات الآمنة العملية عديدة.

يمكن أن يساعد هذا يومًا ما السيارات ذاتية القيادة ، مثل طراز Tesla Model S ، في التعامل بشكل أفضل مع المرور عبر تقاطع أو الاندماج في حركة المرور. يمكن للنموذج تعلم كيفية التعامل مع كل من السائقين العدوانيين والحذرين.


شاهد الفيديو: Designing a University for Exponential Times (سبتمبر 2021).