3 งานวิจัยใช้ AI แปลงคลื่นในสมองเป็นเสียงพูดสังเคราะห์

0

การสื่อสารความต้องการออกมาเป็นคำพูดนั้นเป็นแง่มุมที่สำคัญของชีวิต ในการรับสารหรือสื่อสารออกมาแต่ละครั้ง สมองของเราจะทำการส่งคลื่นไฟฟ้าออกมา ซึ่งแม้เราจะสูญเสียความสามารถในการพูดไปด้วยโรคเช่นอัมพาต โดยมากแล้ว การส่งคลื่นนี้ก็ยังมีการทำงานอยู่ เมื่อไม่นานมานี้ นักวิจัยด้านประสาทวิทยาได้เริ่มนำเทคโนโลยี AI เข้ามาช่วยแปลความหมายจากคลื่นสมอง ซึ่งเป็นก้าวแรกในการพัฒนาการพูดเทียมที่น่าตื่นเต้น

เว็บไซต์ Science นำเสนอ 3 งานวิจัยที่มีความโดดเด่นด้านการแปลงคลื่นสมองของมนุษย์ออกมาเป็นคำพูดสังเคราะห์โดยคอมพิวเตอร์ ซึ่งแม้จะยังทำได้ไม่สมบูรณ์แบบนัก แต่ก็นับเป็นก้าวแรกที่น่าสนใจ หลักการทำงานของงานวิจัยเหล่านี้คือการนำระบบปัญญาประดิษฐ์เข้ามาเรียนรู้ข้อมูลคลื่นสมอง ในขณะที่เจ้าของสมองกำลังอ่านออกเสียง ฟัง หรือพูดแบบไม่มีเสียง

ความท้าทายของงานวิจัยเช่นนี้คือข้อมูลตั้งต้นที่ต้องมีความแม่นยำสูง ดังนั้นจึงสามารถจัดเก็บได้ผ่านเซ็นเซอร์ที่ติดอยู่กับสมองโดยตรง เช่น ในการผ่าตัดสมอง หรือผู้ป่วยโรคลมบ้าหมูที่ต้องมีการติดเซ็นเซอร์บนสมองเพื่อตรวบหาต้นตอของลมชักก่อนการผ่าตัดรักษาเท่านั้น ซึ่งหากเป็นการเก็บข้อมูลระหว่างการผ่าตัดสมอง นักวิจัยจะมีเวลาเก็บข้อมูลเพียง 20-30 นาที

งานวิจัยแรกมาจากข้อมูลสมองของผู้ป่วยโรคลมบ้าหมู 5 ราย นักวิจัยใช้ Neural Network ในการวิเคราะห์สัญญาณที่จับได้จากสมองส่วน Auditory Cortex ในระหว่างที่ผู้ป่วยได้ฟังเรื่องเล่าและคำขานเลข 0 ถึง 9 เพื่อสังเคราะห์การพูดตัวเลขออกมา ซึ่งเมื่อฟังเสียงสังเคราะห์ของคอมพิวเตอร์ ผู้ฟังพบว่าสามารถเข้าใจตัวเลขได้ราว 75%

งานวิจัยถัดมาเป็นผลงานจากข้อมูลที่ได้จากผู้ป่วย 6 รายที่อยู่ระหว่างการผ่าตัดเนื้องอกในสมอง นักวิจัยใช้ไมโครโฟนเก็บเสียงอ่านคำศัพท์ 1 พยางค์ของผู้ป่วยไปพร้อมๆกับการเก็บคลื่นไฟฟ้าจากส่วนวางแผนการพูดและเขตสั่งการซึ่งทำหน้าที่ส่งคำสั่งไปยังอวัยวะที่เกี่ยวข้องกับการเปล่งเสียง จากนั้น พวกเขาใช้ Machine Learning เชื่อมโยงระหว่างสัญญาณสมองและเสียงที่ออกมา และใช้โมเดลนี้ในการสังเคราะห์เสียงจากสัญญาณสมองใหม่ๆ จากการวัดผลพบว่าคำที่สังเคราะห์ออกมานั้นฟังรู้เรื่องประมาณ 40%

งานวิจัยชิ้นสุดท้ายนั้นเป็นการสังเคราะห์คำพูดทั้งประโยคออกมาด้วยการสร้างระบบที่เรียนรู้สัญญาณไฟฟ้าในสมองที่เกิดขึ้นระหว่างการอ่านออกเสียงของผู้ป่วยโรคลมบ้าหมู 3 ราย พวกเขานำผลลัพธ์การสังเคราะห์ไปทดสอบให้ผู้คน 166 คนฟังผ่านช่องทางออนไลน์และเลือกประโยคจาก 10 ตัวเลือก ผลปรากฏว่าผู้ทดสอบสามารถเลือกประโยคได้ถูกต้องถึง 80% และเมื่อทดลองเก็บข้อมูลคลื่นไฟฟ้าจากพูดแบบไม่มีเสียง ก็พบว่าโมเดลที่สร้างขึ้นมานั้นสามารถทำได้เช่นกัน

(รับฟังเสียงสังเคราะจากทั้ง 3 งานวิจัยได้ที่เว็บไซต์ Science)

อย่างไรก็ตาม งานวิจัยในเชิงนี้จะต้องมีการศึกษาต่อไปถึงคลื่นสมองของผู้ป่วยที่ไม่สามารถพูดได้ เพราะการพูดแบบไม่มีเสียงหรือการได้ยิน(หรือคิดถึง)บางอย่างในหัวนั้น แตกต่างจากการพูดออกเสียงและการฟังเสียงจากแหล่งภายนอก ซึ่งเมื่อไม่มีตัวอย่างเสียงจากภายนอกเป็นชิ้นเป็นอันให้ตรวจสอบความถูกต้อง ก็ทำให้งานวิจัยสังเคราะห์เสียงจากความคิดนั้นยากขึ้นไปอีกระดับ

การเชื่อมต่อสมองเข้ากับคอมพิวเตอร์ (Brain-computer Interface) นั้นยังคงเป็นเรื่องที่ผู้คนมีความคาดหวังว่าจะเป็นไปได้ในอนาคต และงานวิจัยเหล่านี้ก็พาพวกเราก้าวเล็กๆเข้าไปใกล้ความเป็นไปได้นั้นอีกก้าว