ครั้งแรกของโลก! Meta AI พัฒนาระบบแปลภาษาพูดแบบเรียลไทม์

0

ระบบแปลที่มีอยู่ปัจจุบัน AI มักอาศัยภาษาเขียนในการพัฒนาโมเดล AI แต่ล่าสุด Meta AI ได้พัฒนาเครื่องมือแปลภาษาสำหรับภาษาพูดที่ไม่มีระบบเขียนอย่างภาษาฮกเกี้ยน เพื่อช่วยสื่อสารสนทนากับผู้ใช้ภาษาอังกฤษได้ นับเป็นระบบแปลด้วย AI ระบบแรกที่เป็น Speech-to-speech translator สำหรับภาษาฮกเกี้ยนด้วย

ระบบแปลแบบ Open source นี้ เป็นส่วนหนึ่งของโปรเจกต์ Universal Speech Translator ของ Meta ที่ทางผู้พัฒนาหวังว่า AI ดังกล่าวจะสามารถใช้แปลเสียงพูดแบบเรียลไทม์ (Real-time speech-to-speech translation) ในทุกภาษา โดยเฉพาะภาษาพูดที่ไม่มีระบบเขียนเป็นมาตรฐาน ซึ่งคาดว่าจะช่วยลดกำแพงทางภาษาและสื่อสารกันได้ แม้แต่ในโลกเมตาเวิร์สด้วยเช่นกัน

โดยปกติแล้ว การฝึก AI ให้เข้าใจภาษามนุษย์ต้องใช้ชุดข้อมูลภาษาเขียนขนาดใหญ่ ซึ่งภาษาฮกเกี้ยนที่มีผู้พูดราว 49 ล้านคนในประเทศต่าง ๆ เช่น จีน ไต้หวัน สิงคโปร์ มาเลเซีย และฟิลิปปินส์ นั้น เป็นเพียงหนึ่งในราว 3,500 ภาษาที่ใช้พูดเป็นหลัก จึงไม่ได้มีชุดข้อมูลขนาดใหญ่พอที่จะฝึก AI ได้ เนื่องจากภาษานี้ไม่ได้มีระบบเขียน จึงเป็นความท้าทายครั้งใหญ่สำหรับผู้พัฒนาระบบ และหันมาเน้นการพัฒนาการแปลจาก Speech-to-speech แทนการแปลจาก Speech-to-text

Image credit: Meta AI

ในเมื่อยังมีภาษาอีกมากมายบนโลกนี้ที่ไม่มีระบบเขียน Meta AI จึงเปิดระบบแปลนี้เป็น Open source ไม่ใช่เพียงแค่สำหรับภาษาฮกเกี้ยนเท่านั้น โดยข้อมูลเสียงพูดอินพุตอย่างภาษาฮกเกี้ยนจะถูกแปลเป็นเสียงอะคูสติกที่ใช้สร้างคลื่นเสียงของภาษานั้น จากนั้นคลื่นเสียงดังกล่าวก็จับเข้ากับภาษาจีนกลาง ซึ่ง Meta ระบุว่าเป็นภาษาที่เกี่ยวข้อง

ทั้งนี้ เครื่องมือแปลดังกล่าวยังอยู่ในขั้นตอนระหว่างพัฒนา เพราะระบบแปลด้วย AI ยังสามารถแปลได้เพียงทีละประโยคต่อครั้ง อย่างไรก็ดี ก็ถือว่าเป็นอีกก้าวหนึ่งของการแปลด้วย AI ซึ่งต้องคอยจับตาดูกันต่อไปว่าเทคโนโลยีนี้จะช่วยลดข้อจำกัดด้านภาษาในทั้งโลกจริงและโลกเสมือนได้จริงดั่งที่ตั้งใจหรือไม่

อ่านรายละเอียดเพิ่มเติมได้ที่ Meta AI Research