ในปัจจุบันนี้มีการใช้ภาษาพูดคุยกันมากกว่า 7,000 ภาษาบนโลก ซึ่งดูเหมือนว่าทาง Meta จะต้องการเข้าใจทุก ๆ ภาษาที่มีบนโลกทั้งหมดด้วย โดย 6 เดือนก่อนบริษัทได้เปิดตัวโครงการ No Language Left Behind (NLLB) เพื่อเทรนระบบ AI ในการแปลระหว่างคู่ภาษากันได้อย่างไร้รอยต่อโดยที่ไม่จำเป็นจะต้องแปลไปเป็นภาษาอังกฤษก่อน
ล่าสุดวันพุธที่ผ่านมา บริษัทได้ประกาศความสำเร็จครั้งใหญ่ในชื่อ NLLB-200 ที่โมเดล AI สามารถพูดได้ถึง 200 ภาษา ซึ่งในนั้นได้รวมภาษาที่มีคนใช้งานในวงแคบ ๆ แถบโซนเอเชียหรือแอฟริกาเท่านั้นด้วย อย่างเช่นภาษาลาว และภาษาคัมบะ (Kamba) เป็นต้น
จากบล็อคโพสของบริษัท NLLB-200 สามารถแปลภาษาแอฟริกันได้ 55 ภาษาด้วยผลลัพธ์ที่มี “คุณภาพสูง” ซึ่ง Meta ยังบอกด้วยว่าประสิทธิภาพของโมเดลในการทดสอบ Benchmark กับ FLORES-101 นั้นพบว่าสามารถเอาชนะโมเดลที่เป็น State-of-the-art ทั้งหลายได้ราว 44% และสามารถสูงถึง 70% ได้เลยหากเป็นภาษาถิ่นของแอฟริกาและอินเดีย
อย่างที่รู้กันว่า การแปลจากภาษาหนึ่งไปอีกภาษาหนึ่งนั้นมีความท้าทายสำหรับโมเดล AI อย่างมีนัยสำคัญ โดยเฉพาะถ้าฝั่งหนึ่งไม่ได้เป็นภาษาอังกฤษแล้วก็จะมีความยากเป็นพิเศษ ซึ่งส่วนหนึ่งนั้นเป็นเพราะระบบแปลภาษาหลาย ๆ ที่ที่พัฒนาขึ้นมานั้นมักจะใช้การดึงข้อมูลที่มีคนเขียนไว้บนอินเทอร์เน็ต แล้วนำข้อมูลเหล่านั้นมาเทรน ซึ่งมันจะพัฒนาขึ้นมาได้ค่อนข้างหากง่ายถ้าหากว่าเป็นภาษาที่มีคนใช้งานในวงกว้างหรือว่าคนทำสามารถพูดหรือเขียนได้คล่องแล้วอยู่แล้ว แต่ถ้าหากเป็นภาษาที่คนใช้งานน้อยอย่างเช่น ภาษาคิคูยู (Kikuyu) ก็จะหาข้อมูลเนื้อหาที่มีคุณภาพเพียงพอในการใช้เทรนโมเดลได้ค่อนข้างยาก
เช่นเดียวกับโครงการ AI อื่น ๆ ทาง Meta ได้ตัดสินใจ Opensource โครงการ NLLB-200 ออกมา พร้อมกับให้เงินทุนสูงถึง 200,000 ดอลลาร์สหรัฐกับทางองค์กรไม่แสวงหาผลกำไรในการพัฒนาแอปพลิเคชันในโลกจริงเพื่อต่อยอดจากเทคโนโลยีนี้ที่ Meta พัฒนาขึ้นมา โดยอาจจะเป็นแอปพลิเคชันที่สามารถนำมาต่อยอดใส่ใน Facebook News Feed หรือว่า Instagram ได้ เป็นต้น
“ลองจินตนาการว่าเมื่อเข้าไปในกลุ่ม Facebook Group ที่ชื่นชอบ แล้วเจอโพสที่เป็นภาษา Igbo หรือ Luganda แล้วปรากฎว่าสามารถเข้าใจมันได้ในภาษาของตัวเอง โดยแค่เพียงคลิกปุ่มเดียว” Meta กล่าวเพื่อมองให้เห็นภาพ ซึ่งมีโอกาสมีการนำเอาโมเดลไปให้บริการใน Facebook เร็ว ๆ นี้
สำหรับคนที่อยากจะรู้ว่าโมเดลใหม่นั้นทำงานเป็นอย่างไร สามารถเข้าไปรับชมในเว็บไซต์เดโมของทาง Meta ได้ที่นี่ และหากใครอยากเข้าไปดูโค้ดของ NLLB-200 สามารถเข้าดูผ่าน GitHub ได้เลย
ที่มา: https://www.engadget.com/meta-ai-translate-200-language-real-time-nllb-130023464.html