การออกแบบ เขียนโปรแกรม และชุดคำสั่งต่าง ๆ ของหุ่นยนต์นั้นเป็นเรื่องที่ซับซ้อนนำมาซึ่งข้อจำกัดด้านทักษะและการเติบโตของการใช้งานหุ่นยนต์ในวงกว้าง แต่การมาถึงของ ChatGPT ได้เปลี่ยนความท้าทายเหล่านี้ให้สะดวกและง่ายดายยิ่งขึ้นด้วยรูปแบบภาษา Natural Language ที่มนุษย์สื่อสารคำสั่งโดยทั่วไป ซึ่ง Microsoft หนึ่งในผู้สนับสนุนหลักได้เปิดเผยถึงแนวโน้มและโอกาสการใช้งาน ChatGPT สำหรับหุ่นยนต์
หลายคนอาจเคยจินตนาการในการใช้ภาษาพูดหรือภาษาสื่อสารทั่วไปในการควบคุมหุ่นยนต์ เช่น “หยิบชิ้นส่วนสีแดงบนชั้นวาง 17 ให้หน่อย” หากพิจารณาการทำงานในรูปแบบเดิมของการใช้งานหุ่นยนต์จะพบว่าคำสั่งนี้เต็มไปด้วยเงื่อนไข คำสั่ง และการบูรณาการทั้งโปรแกรมไปจนถึงฮาร์ดแวร์จำนวนมาก เพียงแค่คำสั่งเดียวยังต้องการโค้ดจำนวนมากในการควบคุม และหากหุ่นยนต์ต้องตอบสนองต่อคำสั่งรูปแบบภาษาอื่น ๆ อาจเรียกได้ว่าแทบเป็นไปไม่ได้เลยที่การสั่งหรือพูดอะไรง่าย ๆ แบบมนุษย์จะทำให้หุ่นยนต์ทำงานได้เหมือนมนุษย์ จนกระทั่ง ChatGPT เกิดขึ้นมา
ChatGPT อนาคตใหม่ของ AI ที่ใช้ Natural Language ได้อย่างลื่นไหล
ChatGPT นั้นเป็นโมเดลภาษาที่ถูกฝึกฝนด้วยข้อความและการปฏิสัมพันธ์ของมนุษย์จำนวนมาก ทำให้สามารถตอบสนองต่อคำสั่งหรือภาษาของมนุษย์ได้ครอบคลุมคำถามที่หลากหลาย หนึ่งในเป้าหมายของ Microsoft ยักษ์ใหญ่ด้านซอฟต์แวร์และดิจิทัลคือการค้นหาว่า ChatGPT นั้นก้าวไปไกลกว่าข้อความบนจอหรือไม่ และที่สำคัญ คือ การใช้งานกับหุ่นยนต์ในโลกกายภาพได้ง่ายดายยิ่งขึ้นโดยไม่ต้องวุ่นวายกับภาษาการเขียนโปรแกรมอันยุ่งยาก และความท้าทายหลัก คือ การใช้ ChatGPT ในการแก้ปัญหาโดยพิจารณาจากกฎของฟิสิกส์ภายใต้บริบทของสภาพแวดล้อมที่ทำงาน และการที่กายภาพของหุ่นยนต์เปลี่ยนแปลงไปในโลกจริง และผลลัพธ์ที่ได้แสดงให้เห็นว่า ChatGPT สามารถทำสิ่งต่าง ๆ ได้มากมายแต่ก็ยังคงไม่สมบูรณ์แบบเหมือนมนุษย์ โอกาสในการพัฒนาและต่อยอดของ AI นี้จึงยังมีอีกมากมาย
ChatGPT กับการเอาชนะความท้าทายในการใช้งานหุุ่นยนต์
ปัญหาหลักในการใช้งานของหุ่นยนต์นั้นมาจากคอขวดด้านวิศวกรรมหรือการใช้งานด้านเทคนิคในการแปลงภาระหน้าที่ต่าง ๆ ที่ต้องทำเป็นโค้ดคำสั่ง ซึ่งการทำงานทุกขั้นตอนต้องมีวิศวกรเพื่อตรวจสอบแก้ไขการทำงานให้ถูกต้อง ซึ่งตรงนี้เองทำให้การทำงานล่าช้าเนื่องจากต้องเขียนโค้ดแบบ Low-level และยังต้องมีต้นทุนมูลค่าสูงเพราะต้องการทักษะเฉพาะทาง หลายครั้งที่ต้องทำวนไปเวียนมาเพื่อให้แน่ใจว่าหุ่นยนต์ทำงานได้ตามรูปแบบที่ต้องการโดยไม่เกิดปัญหา
สิ่งที่ ChatGPT ทำคือการแก้ปัญหาความต้องการวิศวกรในระบบด้วย Large Language Model (LLM) ซึ่งมีฟีดแบคสูง สามารถสร้างโค้ดการทำงานแต่ละขั้นตอนของหุ่นยนต์ได้ ทำให้ผู้ใช้งานไม่จำเป็นต้องเป็นผู้เชี่ยวชาญเชิงเทคนิคสำหรับหุ่นยนต์ทั้งหมด โดย Microsoft ได้ให้แนวคิดด้านการออกแบบคำสั่งสำหรับ ChatGPT เพื่อการใช้หุ่นยนต์ไว้ 4 ข้อ ดังนี้
1. ต้องระบุชุดคำสั่งหุ่นยนต์ High-level API หรือ Function Library ซึ่ง Library ดังกล่าวสามารถระบุหุ่นยนต์จำเพาะและควรทำแผนที่เพื่อบูรณาการลงไปในระดับ Low-level ที่มีอยู่จาก Control Stack ของหุ่นยนต์ โดยการอธิบายชื่อสำหรับ High-level API นั้นเป็นอะไรที่สำคัญอย่างมาก
2. เขียนคำสั่งให้ ChatGPT ต้องอธิบายถึงกิจกรรมเป้าหมายให้ชัดเจนว่าฟังก์ชันใดจาก High-level Library นั้นสามารถใช้ได้ ทั้งในส่วนของ Prompt ยังต้องมีข้อมูลเกี่ยวกับ Constraint สำหรับหน้าที่หรือวิธีที่ ChatGPT ควรจะสร้างคำตอบขึ้นมา เช่น ระบุเลยว่าภาษาโค้ดเป็นอะไร
3. ผู้ใช้งานต้องอยู่ในลูปเพื่อประเมิณ Output ของโค้ดที่ ChatGPT สร้างขึ้นมา ไม่ว่าจะเป็นการตรวจสอโดยตรงหรือการใชโปรแกรมเสมือนจำลองขึ้นมา และในกรณีที่จำเป็นผู้ใช้สามารถใช้ Natural Language เพื่อส่ง Feedback ให้กับคำตอบของ ChatGPT ได้ทั้งในเรื่องคุณภาพและความปลอดภัย
4. เมื่อผู้ใช้งานรู้สึกพอใจกับผลลัพธ์แล้วโค้ดที่เกิดขึ้นสามารถติดตั้งใช้งานกับหุ่นยนต์ได้เลย
ในเบื้องต้นนั้นแม้จะสามารถมองได้ว่าลดการใช้งานวิศวกร แต่ในความเป็นจริงแล้วก็ยังจำเป็นต้องใช้มนุษย์ที่มีทักษะในการสื่อสารและจินตนาการการใช้งานหุ่นยนต์มานั่งแทนที่ เพื่อตรวจสอบลูปการทำงานต่าง ๆ ให้สามารถทำงานได้อย่างราบรื่นไร้ปัญหา
การใช้งาน ChatGPT ในแวดวงอุตสาหกรรม IT นั้นสะท้อนให้เห็นว่าสามารถสร้างโค้ดพื้นฐานเพื่อไปต่อยอดในโครงการได้อย่างมีประสิทธิภาพ ลดเวลาผลักดันสินค้าและบริการออกสู่ตลาดได้เป็นอย่างดี ทั้งยังแก้ปัญหาการขาดแคลนทักษะแรงงานได้อย่างมีประสิทธิภาพด้วย แต่ ChatGPT นั้นยังไม่ได้สมบูรณ์แบบไปเสียหมด การมีแรงงานที่มีทักษะหรือความเข้าใจในหน้าที่ที่มอบหมายในเบื้องต้นและมองเห็นในภาพกว้างจึงเป็นสิ่งสำคัญในการใช้งาน ChatGPT ให้ประสบผลสำเร็จ เพราะอย่างน้อยที่สุดผู้ใช้งานต้องมีความเข้าใจในเรื่องภาษาขั้นพื้นฐานโดยเฉพาะอย่างยิ่งภาษาอังกฤษและความรู้เกี่ยวกับด้านที่ต้องใช้งาน เช่น ศัพท์วิศวกรรม หรือคำที่ใช้ในการผลิตเป็นต้น
ที่มา:
microsoft