การพัฒนาเทคโนโลยีปัญญาประดิษฐ์ไปใช้งานในหุ่นยนต์นั้นนับเป็นความท้าทายของนักวิจัยในปัจจุบัน จากทั่วไปที่ปัญญาประดิษฐ์จะวิเคราะห์ข้อมูลที่ถูกเตรียมพร้อมไว้อยู่แล้ว การทำงานในหุ่นยนต์นั้นแตกต่างออกไปตรงที่ AI จะได้สัมผัสกับข้อมูลสภาพแวดล้อมในโลกแห่งความเป็นจริงที่มีสิ่งรบกวนจำนวนมาก ระบบ AI ที่จะก้าวข้ามความท้าทายนี้จึงต้องเป็น AI ที่มีความสามารถ และความยืดหยุ่นสูงกว่า
ทีมวิจัยปัญญาประดิษฐ์ของ Facebook ก็เป็นหนึ่งในหลายคนที่ให้ความสนใจกับการพัฒนา AI ผ่านหุ่นยนต์เช่นนี้ โดยมุ่งเป้าไปที่การพัฒนาหุ่นยนต์ที่สามารถเรียนรู้การบรรลุเป้าหมายได้ด้วยตัวเองจากข้อมูลรอบกาย และในบล็อกโพสต์เมื่อสัปดาห์ที่ผ่านมา ทีม Facebook AI ก็ได้เผยให้เห็น 2 ตัวอย่างผลงานของพวกเขา
สอนหุ่นยนต์ให้เรียนรู้ที่จะเดินด้วยตัวเองจาก”ความสงสัย”
ทีมงานของ Facebook และ New York University ร่วมกันพัฒนาหุ่นยนต์ที่จะเรียนรู้ที่จะเคลื่อนที่ด้วยตัวเองโดยไม่มีพื้นฐานมาก่อนเลยว่าสภาพแวดล้อมหรือความสามารถทางกายภาพของตัวเองเป็นอย่างไร ซึ่งนั่นก็แปลว่าหุ่นยนต์ตัวนี้ต้องเรียนรู้ทั้งการใช้เซ็นเซอร์กะระยะ การขยับขา การทรงตัว ตำแหน่งที่อยู่ และอื่นๆ ด้วยตัวเองทั้งหมด โดยนอกจากนี้ Facebook ยังได้ตั้งเป้าที่สูงขึ้นไปอีกที่จะพัฒนาระบบที่จะสามารถเรียนรู้ได้อย่างรวดเร็วในหลักชั่วโมงเท่านั้น และสิ่งที่พวกเขาพัฒนาขึ้นมาเพื่อเป้าหมายในครั้งนี้คือระบบ Reinforcement Learning แบบ Model-based ที่ใช้”ความสงสัย”เป็นแรงจูงใจในการเรียนรู้
ก่อนอื่นต้องอธิบายหลักการทำงานพื้นฐานแบบคร่าวๆเสียก่อน AI นั้นจะเรียนรู้แง่มุมต่างๆในการทำงาน และเมื่อมีความรู้เรื่องใดขึ้นมา ระบบก็จะมีรางวัล (Reward) ให้เป็นผลตอบแทน โดยภารกิจขอโมเดลเช่นนี้ก็คือการ Maximise Reward
สิ่งที่ทีมได้พัฒนาเพิ่มเข้ามาในครั้งนี้ คือระบบที่จะตอบแทนความสงสัยของหุ่นยนต์ กล่าวคือหากหุ่นยนต์พยายามเรียนรู้แง่มุมของงานที่ยังไม่แน่ชัด (เช่น ทำนายผลการทำงานออกมาแล้วมี variance ในผลการทำนายมาก) ระบบก็จะให้รางวัลตอบแทนกับหุ่นยนต์มาก ทำให้หุ่นยนต์มีแรงจูงใจในการเรียนรู้สิ่งที่ยังไม่ชัดเจนให้ชัด
โดยจากการศึกษาพบว่าการที่หุ่นยนต์เรียนรู้สิ่งที่ไม่ชัดเจนให้ชัดนั้นจะช่วยให้หุ่นยนต์ทำงานตามเป้าหมายได้สำเร็จไวขึ้น สามารถขยายความสามารถไปใช้ในการทำงานอื่นๆ อีกทั้งการเรียนรู้แบบทดลองไปเรื่อยๆนี้ยังช่วยให้หุ่ยนต์สามารถหลีกเลี่ยงจุดด้อย เช่นการติดไม่ยอมเคลื่อนไหวเมื่อเจออุปสรรคขวางเป็นเวลานาน ได้ด้วย
หุ่นยนต์ที่เรียนรู้ผ่านเซ็นเซอร์สัมผัส
ระบบ AI จำนวนมากในปัจจุบันทำงานด้วยการวิเคราะห์ภาพถ่ายหรือภาพวิดีโอ แต่การทำงานแบบนี้นั้นจะถูกจำกัดในบางสถานการณ์ เช่น มีสิ่งกีดขวางวัตถุที่ต้องการทำให้ภาพโดนบังไป การสัมผัสและการใช้เซ็นเซอร์สัมผัสจึงเข้ามาเป็นอีกแง่มุมหนึ่งของการพัฒนา AI ที่นักวิจัยให้ความสนใจ
ในครั้งนี้ Facebook ร่วมกับนักวิจัยจากสถาบัน UC Berkeley พัฒนาหุ่นยนต์ที่ใช้ Machine Learning ในการเรียนรู้สภาพแวดล้อมจากเซ็นเซอร์สัมผัสและทำนายออกมาว่าปฏิสัมพันธ์แบบไหนจะได้ผลลัพธ์แบบใด และเมื่อได้คำตอบที่ดีที่สุดก็จะแปลงออกมาเป็นลำดับ Action ที่หุ่นยนต์จะต้องทำเพื่อบรรลุเป้าหมายที่ถูกตั้งไว้ ซึ่งงานที่หุ่นยนต์นี้เรียนรู้ที่จะทำได้ก็มีเช่น การกลิ้งลูกบอล การขยับ Joystick และการเปลี่ยนหน้าลูกเต๋า
ซึ่งนอกจากความสำเร็จในการทำให้หุ่นยนต์เรียนรู้แล้ว ความสามารถในการทำนายได้ว่าในสภาพแวดล้อมหนึ่งๆ หากมี Action ทางกายภาพเกิดขึ้น ผลลัพธ์ที่ออกมาจะเป็นไปในลักษณะใดนั้นก็เป็นจุดที่น่าสนใจและสามารถนำมาประยุกต์ใช้กับภาพวิดีโอเพื่อทำนายได้ว่าจากสภาพแวดล้อมในปัจจุบัน จะเกิดเหตุการณ์อย่างไรขึ้นต่อไป
ระบบ AI ดังกล่าวยังแสดงให้เห็นว่าโมเดล AI นั้นสามารถเรียนรู้ที่จะทำนายได้ว่าในสภาพแวดล้อมหนึ่งๆ หากมี Action ทางกายภาพเกิดขึ้น ผลลัพธ์ที่ออกมาจะเป็นไปในลักษณะใด ซึ่งความสามารถนี้ก็เป็นที่น่าสนใจนำไปใช้วิเคราะห์วิดีโอว่าจะเกิดเหตุการณ์อะไรขึ้นต่อจากสถานการณ์ที่ปรากฏอยู่ในปัจจุบัน
ผลลัพธ์ที่ Facebook ได้จากการพัฒนาและวิจัยหุ่นยนต์เช่นนี้นั้นไม่เพียงเป็นการสร้างหุ่นยนต์ที่มีความสามารถมากขึ้น แต่พวกเขายังได้พัฒนา AI ที่สามารถเรียนรู้ได้อย่างรวดเร็วมีประสิทธิภาพมากขึ้น และสามารถขยายขีดความสามารถไปประยุกต์ใช้ในงานที่หลากหลายได้อีกด้วย