NVIDIA เปิดตัว “eDiff-I” AI สร้างภาพวาดจากข้อความ เตรียมสู้ DALL-E, ImageGen

November 21, 2022

เรียกว่าเป็นช่วงเวลาที่ร้อนแรงขึ้นเรื่อย ๆ ของวงการ AI โดยล่าสุด NVIDIA ได้ประกาศเข้าสู่สังเวียนในด้าน AI สร้างภาพจากข้อความ (Text-To-Image) ภายใต้ชื่อ “eDiff-I” เตรียมแข่งขันกับ DALL-E ของ OpenAI, ImageGen ของ Google และ Make-a-Scene ของ Meta

กระแส Generative AI ที่กำลังร้อนแรงขึ้นเรื่อย ๆ หลายองค์กรยักษ์ใหญ่ของโลกก็ตบเท้าเริ่มพัฒนาระบบ AI ในลักษณะ Generative Model ออกมาให้เห็นกันมากขึ้น ซึ่งล่าสุดคือ NVIDIA ที่ได้ส่ง eDiff-I ออกมาแข่งขันในสังเวียนนี้ด้วยแล้ว

โดย NVIDIA เผยว่าโมเดล Text-To-Image ของบริษัทนั้นจะแตกต่างไปจากโมเดลของแพลตฟอร์มอื่น ๆ โดยที่จะสามารถสังเคราะห์ (Synthesis) ภาพได้จากกระบวนการเกลี่ยสัญญาณรบกวนแบบต่อเนื่อง (Iterative Denoising Process) ซึ่ง NVIDIA eDiff-I ได้ใช้ตัว Denoiser อันชาญฉลาดหลาย ๆ ตัวมาช่วยกันทำให้เกิดภาพที่สร้างขึ้นมาได้

นักพัฒนา NVIDIA ผู้ที่อยู่เบื้องหลัง eDiff-I อธิบายว่าโมเดลนี้เป็น “ยุคใหม่ของเครื่องมือ Generative AI ที่สามารถสังเคราะห์ข้อความเป็นภาพได้แบบที่ไม่เคยมีมาก่อน ด้วยความสามารถในการถ่ายโอนสไตล์ (Style Transfer) ได้ทันที และความสามารถในการวาดภาพด้วยคำที่ใช้งานได้ง่าย”

สำหรับผู้ที่สนใจรายละเอียดเต็ม ๆ ของ eDiff-I สามารถอ่านในงานตีพิมพ์ได้ที่นี่