Stability AI บริษัทผู้อยู่เบื้องหลัง Stable Diffusion เทคโนโลยี Generative AI ในรูปแบบ Text-To-Image ยอดนิยมระดับโลกนั้นล่าสุดได้เปิดตัวโมเดลใหม่ “Stable Cascade” ที่มีประสิทธิภาพเหนือกว่าและซับซ้อนมากกว่าโมเดล Stable Diffusion รุ่นปัจจุบัน
Stability AI ถือว่ามีการอัปเดตแกนของโมเดล Stable Diffusion ออกมาอย่างต่อเนื่องตั้งแต่ปี 2022 แล้ว อาทิ SDXL 1.0 ที่ปล่อยออกมาตั้งแต่ ก.ค.2023 ที่ผ่านมา หรือ SDXL Turbo ที่ปล่อยออกมาเมื่ื่อ พ.ย.2023 เป็นต้น
หากแต่ Stable Cascade นั้นจะมีลักษณะโครงสร้างสถาปัตยกรรมภายในจะแตกต่างไปจาก SDXL อยู่พอสมควรในการใช้สังเคราะห์ภาพขึ้นมา ซึ่งนักวิจัยแห่ง Stability AI หวังว่าจะมีประสิทธิภาพมากกว่าเดิมด้วยวิธีใหม่ที่สร้างอยู่บนสถาปัตยกรรม Würstchen ที่ผสมผสานเทคนิคนวัตกรรมหลากหลายอย่างเพื่อปรับปรุงประสิทธิภาพและความถูกต้อง
โดยภายใน Stable Cascade นั้นจะเป็นสถาปัตยกรรม 3 สถานะ (Stage) คือมีโมเดลเล็ก ๆ อยู่ภายใน 3 ส่วนด้วยกันคือ Stage A, B และ C โดย Stage C จะแปลงข้อความ Prompt ให้กลายเป็นเหมือนภาพอธิบายขนาด 24×24 พิกเซลจากนั้น Stage A และ Stage B จะทำการถอดรหัส (Decode) เพื่อแปลงให้กลายเป็นภาพความละเอียดสูงต่อไป
จากการประเมินผลโดย Stability AI เผยว่า Stable Cascade นั้นสามารถเอาชนะโมเดล AI ที่ทำงานในลักษณะเดียวกันได้ (รวมไปถึง SDXL ด้วย) ทั้งในแง่ของคุณภาพของภาพที่ได้ และความสอดคล้องกับ Prompt ที่ส่งเข้าไป
สำหรับผู้ที่สนใจสามารถเข้าไปศึกษารายละเอียดของ Stable Cascade จาก Stability AI ได้ที่นี่