อีกขั้น! คอมพิวเตอร์เริ่มเข้าใจภาษามนุษย์มากขึ้น

0
https://techcrunch.com/wp-content/uploads/2018/03/speech-balloons.png?w=1390&crop=1

ระบบคอมพิวเตอร์เริ่มเข้าใจภาษามนุษย์มากขึ้น แต่ก็ยังคงมีจุดอ่อนอยู่บ้าง ซึ่งก็คือปัญหาเรื่องคำที่มีความหมายหลากหลายหรือความหมายซับซ้อน จึงเกิดระบบใหม่ขึ้นมาชื่อว่า ELMo ที่ช่วยเพิ่มบริบทของคำ ทำให้เข้าใจความหมายได้ดีขึ้น

คำหนึ่งคำอาจมีความหมายได้มากกว่าหนึ่ง ยกตัวอย่างเช่นคำว่า “queen” อาจหมายถึงราชินีอลิซาเบธ หรือตัวหมากรุก นางพญาผึ้งหรือนางพญามด หรือรายการ Drag Race ของ RuPaul โดยอาศัยบริบทที่เข้าใจกันระหว่างคู่สนทนาว่ากำลังหมายถึงอะไร ลักษณะคำที่มีความหมายมากกว่าหนึ่ง เรียกว่า คำที่มีความหมายหลายนัย (polysemy)

แต่ระบบ machine learning นั้นไม่ได้มีลักษณะยืดหยุ่นถึงขั้นที่จะเข้าใจความหมายของคำตามบริบทได้ทันที วิธีการที่ระบบมักนำเสนอคำก็เป็นวิธีการง่ายๆ นั่นคือ ดูคำจำกัดความต่างๆ ทั้งหมดของคำนั้นๆ และแสดงผลตามค่าเฉลี่ยแม้ว่าจะไม่ตรงกับความซับซ้อนที่แท้จริงนั้น วิธีการนี้เลยมักจะพึ่งไม่ได้

ELMo (Embeddings from Language Models) จึงนับว่าเป็นอีกทางเลือกหนึ่งที่เข้ามาช่วยรับมือกับคำที่มีความหมายหลายนัย ซึ่งล่าสุดงานวิจัยพึ่งจะได้รับรางวัลจาก NAACL ระบบนี้ใช้ข้อมูลฝึกที่เป็นชุดข้อความขนาดใหญ่เพื่อดูว่าคำคำหนึ่งมีหลายความหมายหรือไม่ และดูว่าความหมายที่ต่างกันออกไปนั้นมีลักษณะการใช้งานอย่างไรในภาษา

ดังเช่นตัวอย่างคำว่า “queen” ข้างต้น เมื่อระบบย่อยประโยคและดูจากคำในบริบทว่าเป็นเรื่องความจงรักภักดีหรือเรื่องเกมหมากรุก ก็สามารถระบุความหมายที่เข้ากับบริบทนั้นได้ เช่น หากระบบเห็นคำว่า king ใกล้ๆ คำว่า queen ด้วย ก็อาจหมายถึงราชวงศ์หรือเกม แต่ไม่ได้หมายถึงรังผึ้งแน่นอน ถ้าเห็นคำว่า pawn (เบี้ย) ก็รู้ได้ทันทีว่ากำลังพูดถึงหมากรุก พอเห็นคำว่า “jack” ก็หมายถึงไพ่ เป็นต้น นอกจากนี้ การที่ระบบดูรูปประโยคเป็นก็ทำให้ระบบสามารถแตกโครงสร้างประโยคได้ง่าย และสามารถแยกอนุประโยค (clause) และประเภทของคำ (part of speech) ได้โดยอัตโนมัติ

ระบบ ELMo อาจยังไม่สามารถทำงานได้เต็มประสิทธิภาพดีเทียบเท่ากับความสามารถของมนุษย์ที่ใช้เวลาหลายปีในการเรียนรู้ภาษา แต่การมีความรู้เรื่องคำที่มีความหมายหลายนัยก็นับเป็นประโยชน์อย่างมากในการเข้าใจภาษา

ระบบที่ใช้วิธี ELMo นี้จะได้รับประโยชน์โดยตรงในเรื่องของการพัฒนาอัลกอริธึมภาษาธรรมชาติ (natural language) ซึ่งเพิ่มขึ้นถึง 25 เปอร์เซ็นต์ และเมื่อระบบนั้นเป็นระบบที่รับรู้ถึงบริบทมากขึ้น แต่ไม่ได้เปลี่ยนเป็นระบบใหม่ ก็สามารถนำไปผนวกเข้ากับระบบเชิงการค้าที่มีอยู่แล้วได้โดยง่าย ทั้งนี้ มีข่าวลือว่า Microsoft ได้ใช้ระบบนี้กับ Bing แล้ว

ELMo เป็น open source เช่นเดียวกับงานจาก Allen Institute ด้าน AI ฉะนั้นบริษัทที่ทำงานเกี่ยวกับเรื่อง natural language processing อาจลองเข้าไปใช้ดูได้

แม้ว่างานวิจัยการใช้ ELMo จะใช้ภาษาอังกฤษเป็นหลัก แต่เนื่องด้วยความสามารถในการอ่านข้อมูลที่ถูกป้อนเข้าไป จึงไม่มีเหตุผลทางทฤษฎีที่จะบอกว่าใช้กับภาษาอื่นไม่ได้ หรือแม้แต่กับศาสตร์อื่น เช่น ถ้าป้อนข้อมูลด้านประสาทวิทยา ระบบก็ควรจะแยกความต่างระหว่างคำว่า temperal ที่เกี่ยวกับเวลา และที่เกี่ยวกับสมองได้

ผลงานนี้จึงเป็นอีกตัวอย่างหนึ่งที่แสดงให้เห็นการทำงาน machine learning กับด้านภาษากำลังพัฒนาไปด้วยกัน ถึงแม้ว่าระบบในขณะนี้ยังพอทำงานได้ค่อนข้างดีเรื่องการแปลง่ายๆ การแปลงคำพูดเป็นข้อความ (speech to text) เป็นต้น แต่ก็ยังมีอะไรที่คอมพิวเตอร์อาจทำได้อีกผ่านทาง natural language interface เพียงแค่มันรู้วิธีการเท่านั้นเอง