ทีมอาจารย์วิศวฯ จุฬาฯ พัฒนา “Gowajee” AI ไทยแท้ ถอดความภาษาไทยแม่นยำราวเจ้าของภาษา

0

ผู้ใช้สมาร์ตโฟนคงคุ้นเคยกับ “OK Google” หรือ “Hey Siri” ผู้ช่วยเสียง AI บนมือถือของเรากันอยู่แล้ว แต่ปัญหาคือ AI ที่พัฒนาโดยต่างชาตินั้น ไม่ค่อยแม่นยำเท่าใดนักหากต้องใช้งานเป็นภาษาไทย ทีมอาจารย์จากคณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย จึงได้พัฒนา AI ชื่อว่า “Gowajee” (โก-วาจี) เพื่อแก้ปัญหาจุดนี้โดยเฉพาะ

Gowajee มาจากคำว่า Go กับคำว่า “วาจี” หรือ “วจี” เพื่อใช้เป็นคำสั่งเปิดใช้งาน AI ถอดเสียง คล้าย ๆ กับคำสั่ง OK Google หรือ Hey Siri ซึ่งแยกออกจากคำพูดที่เราใช้กันในชีวิตประจำวัน เพื่อป้องกันมิให้ AI ทำงานในขณะที่เราไม่ได้ต้องการเรียกใช้งาน

Gowajee เป็น AI ที่ร่วมพัฒนาโดย อ.ดร.เอกพล ช่วงสุวนิช อาจารย์ภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย และทีม เพื่อสร้าง AI สัญชาติไทยที่เข้าใจภาษาไทยโดยเฉพาะ และสามารถถอดความภาษาไทยได้อย่างแม่นยำ โดยมีความผิดพลาดทางภาษาเพียง 9% เท่านั้น เมื่อเทียบกับ AI อื่น ๆ ที่ราว 15%

Image credit: Gowajee

ทีมผู้พัฒนา Gowajee ได้เริ่มเก็บฐานข้อมูลเสียงภาษาไทยมาตั้งแต่ปี 2560 ในหลายรูปแบบและวิธีการ เช่น การเปิดเว็บไซต์ให้คนเข้ามาอ่านข้อความ จ้างคนมานั่งสนทนา จ้างนักแสดงมาพูดสื่อสารอารมณ์ รวมกว่า 5,000 ชั่วโมง จนทำให้มั่นใจได้ว่ามีข้อมูลมากเพียงพอสำหรับการถอดความภาษาไทยได้อย่างแม่นยำ

Gowajee สามารถนำไปประยุกต์ใช้งานได้หลากหลาย ได้แก่ 

  • การแปลงเสียงถอดความเป็นตัวอักษร (Automated Speech Recognition หรือ ASR
  • การแปลงข้อความเป็นเสียงพูด (Text-to-Speech หรือ TTS)
  • การยืนยันตัวตนผู้พูดด้วยเสียง (Automatic Speaker Verification หรือ ASV) เหมาะสำหรับใช้ยืนยันตัวตนในการติดต่อกับ Call Center

ปัจจุบันมีหน่วยงานต่าง ๆ ทั้งมหาวิทยาลัย ภาครัฐและเอกชน เริ่มนำ Gowajee ไปใช้งานแล้ว โดยเฉพาะงานบริการ Call Center สำหรับการถอดเสียงเป็นข้อความ และการถอดข้อความเป็นเสียง รวมถึงมีการประยุกต์ใช้งานอื่น ๆ เช่น การใช้งานถอดความร่วมกับการใช้โมเดลจำแนกอารมณ์จากเสียงพูด เพื่อนำไปวิเคราะห์คัดกรองผู้ป่วยโรคซึมเศร้าบนแอปพลิเคชัน DMIND

อ.ดร.เอกพล เผยถึงความเป็นไปได้ในการประยุกต์ใช้งาน Gowajee เพิ่มเติมในบริบทต่าง ๆ ด้วย เช่น การใช้ Gowajee บันทึกข้อความขณะทันตแพทย์กำลังรักษาคนไข้ การใช้ Gowajee ช่วยตรวจหาความเสี่ยงภาวะ Stroke ของผู้ป่วยที่เริ่มพูดไม่ชัด การใช้งานร่วมกับผู้สูงอายุเพื่อขยายเสียงพูดให้ได้ยิน เป็นต้น

ผู้ที่สนใจ Gowajee สามารถอ่านรายละเอียดเพิ่มเติมหรือทดลองใช้งานได้ที่ https://www.gowajee.ai/