جوجل تقدم نموذجًا جديدًا للذكاء الاصطناعي يعلم الروبوتات التخلص من القمامة
لسنوات كان الناس يحلمون بمستقبل تلعب فيه الروبوتات دورًا مهمًا في مساعدة البشر في مختلف المهام. الآن ، أصبح هذا المستقبل أقرب من أي وقت مضى.
قدمت شركة جوجل Google Robotics Transformer 2، أو RT-2 ، وهو نموذج ذكاء اصطناعي رائد مصمم لتدريب الروبوتات على أداء إجراءات واقعية مثل التخلص من القمامة، ما يمثل قفزة كبيرة إلى الأمام في تطوير الروبوتات المفيدة والقابلة للتكيف.
على عكس روبوتات المحادثة التي أصبحت مألوفة، تتطلب الروبوتات فهمًا أعمق للعالم الحقيقي والقدرة على التعامل مع المواقف المعقدة وغير المألوفة.
قالت جوجل إن تعليم الروبوتات لأداء المهام العامة كان عملية تستغرق وقتًا طويلاً ومكلفة، وتتضمن تدريبًا مكثفًا على كميات هائلة من نقاط البيانات عبر كائنات وبيئات وسيناريوهات لا حصر لها.
مع إطلاق RT-2 ، وجدت جوجل طريقة جديدة لمواجهة هذه التحديات لاسيما أنه نموذج رؤية - لغة - حركة (VLA) ، يعتمد على بنية Transformer، والتي يمكنها فهم ومعالجة النصوص والصور من الويب.
مثلما تتعلم نماذج اللغة من بيانات الويب لفهم المفاهيم، تنقل RT-2 هذه المعرفة لتوجيه الروبوتات حول كيفية تنفيذ إجراءات محددة.
تكمن القوة الرئيسية لـ RT-2 في قدرتها على التحدث بـ "الروبوت"، إنه يمكّن الروبوتات من التفكير واتخاذ القرارات بناءً على بيانات التدريب الخاصة بهم، مما يسمح لهم بالتعرف على الأشياء في السياق وفهم كيفية التفاعل معها.
على سبيل المثال يمكن لـ RT-2 تحديد القمامة والتقاطها دون تدريب مكثف على هذه المهمة المحددة، لأنه يفهم الطبيعة المجردة للقمامة، ويدرك أن ما كان يومًا كيسًا من رقائق البطاطس أو قشر الموز يصبح نفايات بعد الاستخدام.
تطلبت الأنظمة الروبوتية السابقة حزمًا معقدة من الأنظمة ، حيث كان يتعين على التفكير عالي المستوى والمعالجة منخفضة المستوى التواصل للتحكم في تصرفات الروبوت. يقضي RT-2 على هذا التعقيد من خلال دمج المهام في نموذج واحد.
نتيجة لذلك يمكن للنموذج أن يقوم بالتفكير المعقد وإخراج إجراءات الروبوت مباشرة، مما يبسط عملية صنع القرار في الروبوت.
بعد اختبار RT-2 في أكثر من 6000 تجربة روبوتية وجد فريق جوجل نتائج رائعة، في المهام التي تم تدريب النموذج عليها (المعروفة باسم مهام "المشاهدة").
ومع ذلك فإن فقد تحسن أداءها في السيناريوهات الجديدة غير المرئية بشكل كبير، حيث تضاعف تقريبًا إلى 62 في المائة مقارنة بـ RT-1 بنسبة 32 في المائة.
يمكن للروبوتات المجهزة بـ RT-2 أن تتكيف بسرعة مع المواقف والبيئات الجديدة، تمامًا مثل كيفية تعلم البشر من خلال نقل المفاهيم إلى سيناريوهات جديدة.
بينما لا يزال هناك عمل يتعين القيام به لتمكين الروبوتات في البيئات التي تركز على الإنسان بشكل كامل ، يقدم RT-2 لمحة واعدة عما ينتظرنا في المستقبل في مجال الروبوتات.