หน่วยวิจัย Microsoft AI Research ได้ประกาศความก้าวหน้าครั้งใหม่ในเรื่องระบบ AI ในด้านที่เกี่ยวกับการสนทนา (conversational AI) ที่สามารถสร้างสถิติใหม่จาก 7 ใน 9 งานในด้านการประมวลผลภาษาธรรมชาติ (Natural Language Processing : NLP) จาก benchmark ของ General Language Understanding Evaluation (GLUE)
อัลกอริทึมการประมวผลในด้าน NLP ของ Microsoft นี้เรียกว่า Multi-Task DNN (MT-DNN) ซึ่งได้มีการปล่อยออกมาในเดือนมกราคมและมีการอัพเดทล่าสุดในเดือนนี้ โดยเป็นทำงานร่วมกันกับโมเดล NLP ของ Google BERT เพื่อที่จะได้ผลลัพธ์ที่ดีกว่าเดิมได้สำเร็จ
“ในงานแต่ละอย่างนั้น พวกเราเทรนกลุ่ม MT-DNN ที่แตกต่างกันขึ้นมาหลายๆ ตัวที่สามารถดำเนินการได้ประสิทธิภาพที่ดีกว่าโมเดลเดี่ยวๆ (เสมือนกับเป็นโมเดลคุณครู) แล้วจากนั้นจึงเทรนโมเดล MT-DNN แบบเดี่ยวขึ้นมาให้เรียนรู้ในการดำเนินการหลายๆ งานได้ ซึ่งจะสามารถสกัดความรู้ออกมาจากกลุ่มโมเดลคุณครูได้ (เสมือนกับเป็นโมเดลนักเรียน)” จากสรุปใจความสำคัญของงานตีพิมพ์ “Improving Multi-Task Deep Neural Networks via Knowledge Distillation for Natural Language Understanding.”
สถิติใหม่ที่ได้สร้างขึ้นมาบนประเด็นในกลุ่มชุมชนเรื่องระบบ AI เกี่ยวกับเสียงในการปรับปรุงอัลกอริทึม conversational AI นั้นประกอบด้วยโครงข่ายประสาทเทียม (Neural Network) ที่สามารถทำงานด้านการรู้จำเสียง (speech recognition) การเข้าใจภาษาธรรมชาติ (natural languange understanding) และระบบแปลงข้อความไปเป็นเสียง (text-to-speech system)
“โมเดลเดี่ยวที่สกัดความรู้ออกมานั้นสามารถเพิ่มค่า benchmark ของ GLUE ได้เป็น 83.7% ด้วยจำนวนที่เพิ่มมา 3.2% จากการทดสอบด้วย BERT และ 1.5% ที่เหนือกว่าวิธีการ state-of-the-art อื่นๆ ที่อิงจาก GLUE leaderboard2 ณ วันที่ 1 เมษายน 2562 ที่ผ่านมา” นักวิจัยกล่าว
ผลทดสอบและโค้ดล่าสุดนั้นจะมีการอัพโหลดไว้บน GitHub ในเดือนมิถุนายนที่จะถึงนี้
Source : https://news.developer.nvidia.com/microsoft-announces-new-breakthroughs-in-ai-speech-tasks/