RT-2 โมเดลหุ่นยนต์รุ่นใหม่ที่แปลงภาพและข้อความให้เป็นการกระทำจาก Google DeepMind
Robotic Transformer 2 (RT-2) จาก Google DeepMind เป็น โมเดล Vision-Language-Action (VLA) ที่เรียนรู้จากทั้งเว็บและข้อมูลหุ่นยนต์และเปลี่ยนแปลความรู้เหล่านี้เป็นคำแนะนำทั่วไปสำหรับการควบคุมหุ่นยนต์
(more…)