Meta เปิดตัว “Audiobox” โมเดล AI โคลนเสียง เอาไปสังเคราะห์เสียงพูดได้ตามข้อความ Prompt

0

โมเดล Generative AI เรียกว่าร้อนแรงจริง ๆ ในช่วงเวลานี้ ซึ่งล่าสุดคือ Audiobox โมเดล AI ด้านเสียงล่าสุดที่ Meta เปิดตัวที่ออกมาในช่วงนี้ โดยสามารถโคลนเสียงพูด ทั้งโทน สไตล์ จังหวะ การเน้นเสียง แล้วเอาไปสังเคราะห์เสียงพูดได้ตามข้อความ Prompt 

โดยโมเดล Audiobox นี้ “สามารถสังเคราะห์เสียงและ Sound Effect ได้ด้วยการใช้การผสมผสาน Input ระหว่างเสียงกับข้อความ Prompt ที่เป็นภาษาธรรมชาติ ซึ่งจะทำให้การปรับแต่งเสียงแบบ Custom ทำได้ง่ายขึ้น ที่สามารถนำไปใช้งานได้ในอีกหลากหลาย Use Case”

โดยนักวิจัยจาก Facebook AI Research (FAIR) อธิบายว่า Audiobox นี้เป็น “Foudation Research Model ใหม่สำหรับงานด้านการสังเคราะห์เสียง” ที่ถูกสร้างต่อยอดมาจากชิ้นงานก่อนหน้าอย่าง Voicebox นั่นเอง

หากใครสนใจสามารถลองเข้าไปเล่นได้ที่เว็บไซต์ตัวเดโม ซึ่งสร้างขึ้นมาเพื่อวัตถุประสงค์สำหรับงานวิจัยเท่านั้นได้ที่นี่ ซึ่งจะเห็นว่าโมเดล Audiobox มีถึง 6 ฟีเจอร์สามารถนำไปต่อยอดสร้างสรรค์ได้ง่าย ๆ เลยในอนาคต

https://audiobox.metademolab.com/capabilities/tts_in_context

ที่มา: https://venturebeat.com/ai/meta-unveils-audiobox-an-ai-that-clones-voices-and-generates-ambient-sounds/