نشرت شركة بوسطن ديناميكس
وتحدث Spot خلال مقطع الفيديو قائلًا: “هل نبدأ رحلتنا من محطات الشحن، حيث تستريح روبوتات Spot وتعيد شحنها، وهي نقطة اهتمامنا الأولى. اتبعوني أيها السادة”.
وكما هو موضح في مقطع الفيديو، فإن Spot قادر على الإجابة على الأسئلة وحتى فتح فمه ليبدو وكأنه يتحدث.
واستخدمت بوسطن ديناميكس واجهة برمجة تطبيقات ChatGPT المملوك لشركة OpenAI إلى جانب بعض النماذج اللغوية الكبيرة المفتوحة المصدر لجعل Spot يتحدث وتدريبه على الرد.
وجهزت الشركة الروبوت بمكبر صوت، وأضافت إمكانات تحويل النص إلى كلام، وجعلت فمه يتحرك ليحاكي الكلام.
موضوعات ذات صلة بما تقرأ الآن:
وقال مات كلينجينسميث، مهندس البرمجيات الرئيسي في بوسطن ديناميكس: “أعطى الفريق روبوت Spot نصًا موجزًا للغاية لكل غرفة من الغرف في المنشأة. وأدمج الروبوت بعد ذلك هذا النص مع الصور التي يحصل عليها من الكاميرات الموجودة في جسمه وفهمه، مما يسمح له بالحصول على المزيد من المعلومات حول ما يراه قبل توليد استجابة”.
ووفقًا للشركة، يستخدم روبوت Spot نماذج “الإجابة عن الأسئلة المرئية” للتسميات التوضيحية للصور والإجابة عن الأسئلة المتعلقة بتلك الصور.
ولا يحاكي Spot ضمن مقطع الفيديو شخصية الدليل السياحي فقط، بل يحاكي الروبوت ذو الأرجل الأربعة أيضًا شخصية عالم آثار في عشرينيات القرن الماضي ومراهق وشكسبير المسافر عبر الزمن، حتى أن الروبوت يحاكي شخصية ساخرة.
وتشير بوسطن ديناميكس إلى أنها اكتشفت بعض المفاجآت عند تجربة Spot بصفته مرشدًا سياحيًا، إذ سأل الفريق Spot عن والديه في إحدى الحالات، مما جعل الروبوت ينتقل إلى المكان المتضمن نماذج Spot الأقدم في مقر الشركة.
وأوضحت الشركة أنها لا تزال تواجه بعض الحالات التي اختلق فيها النموذج اللغوي الكبير الأشياء، مثل اقتراح Spot أن روبوت Stretch مصنع لممارسة اليوغا، مع أنه مصمم لنقل الصناديق.
وكتب كلينجينسميث في تدوينة عبر موقع بوسطن ديناميكس: “نحن متحمسون لمواصلة استكشاف التقاطع بين الذكاء الاصطناعي والروبوتات. تساعد هذه النماذج اللغوية الكبيرة في توفير السياق الثقافي، والمعرفة العامة المنطقية، والمرونة المفيدة للعديد من مهام الروبوتات”.
أخبار متعلقة :