ช่วงนี้ภาพที่สร้างขึ้นด้วย AI กำลังฮิตในโลกโซเชียล ล่าสุด OpenAI ได้พัฒนา Point-E ระบบเรียนรู้ที่สร้างวัตถุ 3 มิติ จากข้อความภายใน 2 นาที
Point-E ไม่ได้สร้างวัตถุ 3 มิติขึ้นมาเอง แต่สร้างขึ้นมาเป็น Point Cloud (กลุ่มของจุดในรูปแบบ 3 มิติ) และชุดของจุดข้อมูลพื้นที่ที่นำเสนอรูปทรง 3 มิติ จึงเป็นที่มาของชื่อ Point-E ที่ตัว “E” มาจากคำว่า “efficiency” (ประสิทธิภาพ) เพราะวิธีนี้สร้างวัตถุ 3 มิติได้เร็วกว่าวิธีก่อน ๆ
แม้ว่าวิธีนี้จะง่ายในการสังเคราะห์ Point Cloud จากมุมมองการคำนวณ แต่ยังเก็บรายละเอียดพื้นผิวได้ไม่ดีเท่าที่ควร ทีมพัฒนาจึงฝึกระบบ AI เพิ่มเติมเพื่อแปลง Point Cloud ให้กลายเป็นตาข่าย (Meshes) ที่ใช้กำหนดวัตถุในการสร้างและออกแบบโมเดล 3D ทั้งนี้ ผลที่ออกมาอาจคลาดเคลื่อนและทำให้วัตถุดูเป็นทรงเหลี่ยม ๆ หรือบิดเบี้ยวไปบ้างบางส่วน
Point-E ยังประกอบด้วยโมเดลอีก 2 ส่วน คือ โมเดล Text-to-image และ Image-to-3D โดยโมเดล Text-to-image ที่แปลงข้อความเป็นภาพนั้นใช้วิธีการเดียวกับ DALL-E 2 และ Stable Diffusion ของ OpenAI ที่ฝึกจากภาพที่กำหนด Label ไว้ เพื่อให้ระบบเข้าใจความเชื่อมโยงของคำและภาพ ส่วนโมเดล Image-to-3D นั้นได้รับการป้อนชุดข้อมูลภาพจับคู่กับวัตถุ 3 มิติ เพื่อให้ระบบเข้าใจและแปลผลได้แม่นยำขึ้น
นักวิจัย OpenAI เผยว่า Point-E อาจนำไปใช้สร้างวัตถุในโลกจริง ในลักษณะของการพิมพ์สามมิติได้ และหากปรับแต่งโมเดลให้แม่นยำขึ้น ก็อาจเข้ามาเป็นส่วนหนึ่งของการพัฒนาเกมและแอนิเมชันต่อไปได้เช่นกัน
OpenAI ได้เปิด Point-E เป็น Open-source ให้นักพัฒนาลองเข้าไปสัมผัสกันได้ที่ https://github.com/openai/point-e