เรียกว่าเป็นช่วงเวลาที่ร้อนแรงขึ้นเรื่อย ๆ ของวงการ AI โดยล่าสุด NVIDIA ได้ประกาศเข้าสู่สังเวียนในด้าน AI สร้างภาพจากข้อความ (Text-To-Image) ภายใต้ชื่อ “eDiff-I” เตรียมแข่งขันกับ DALL-E ของ OpenAI, ImageGen ของ Google และ Make-a-Scene ของ Meta
กระแส Generative AI ที่กำลังร้อนแรงขึ้นเรื่อย ๆ หลายองค์กรยักษ์ใหญ่ของโลกก็ตบเท้าเริ่มพัฒนาระบบ AI ในลักษณะ Generative Model ออกมาให้เห็นกันมากขึ้น ซึ่งล่าสุดคือ NVIDIA ที่ได้ส่ง eDiff-I ออกมาแข่งขันในสังเวียนนี้ด้วยแล้ว
โดย NVIDIA เผยว่าโมเดล Text-To-Image ของบริษัทนั้นจะแตกต่างไปจากโมเดลของแพลตฟอร์มอื่น ๆ โดยที่จะสามารถสังเคราะห์ (Synthesis) ภาพได้จากกระบวนการเกลี่ยสัญญาณรบกวนแบบต่อเนื่อง (Iterative Denoising Process) ซึ่ง NVIDIA eDiff-I ได้ใช้ตัว Denoiser อันชาญฉลาดหลาย ๆ ตัวมาช่วยกันทำให้เกิดภาพที่สร้างขึ้นมาได้
นักพัฒนา NVIDIA ผู้ที่อยู่เบื้องหลัง eDiff-I อธิบายว่าโมเดลนี้เป็น “ยุคใหม่ของเครื่องมือ Generative AI ที่สามารถสังเคราะห์ข้อความเป็นภาพได้แบบที่ไม่เคยมีมาก่อน ด้วยความสามารถในการถ่ายโอนสไตล์ (Style Transfer) ได้ทันที และความสามารถในการวาดภาพด้วยคำที่ใช้งานได้ง่าย”
สำหรับผู้ที่สนใจรายละเอียดเต็ม ๆ ของ eDiff-I สามารถอ่านในงานตีพิมพ์ได้ที่นี่
ที่มา: https://venturebeat.com/ai/nvidia-takes-on-dall-e-and-stable-diffusion-with-ediff-i/