MIT สร้างเครื่องมือตัดต่อภาพด้วย AI ที่ช่วยเปลี่ยนพื้นหลังในรูปได้

0
https://cdn0.tnwcdn.com/wp-content/blogs.dir/1/files/2018/08/Woman-dancing-credit-MIT-CSAIL-796x391.png

MIT Computer Science and Artificial Intelligence Lab (CSAIL) ได้พัฒนาเครื่องมือปรับแต่งรูปภาพด้วย AI ที่ช่วยเลือกวัตถุได้อัตโนมัติ

สำหรับคนหลายล้านคน โปรแกรม Photoshop ถือเป็นโปรแกรมที่ใช้ปรับแต่งภาพได้ดีที่สุด แต่บางทีก็เสียเวลาพอสมควรและใช้งานยาก สิ่งที่เรามองหาจึงเป็น AI ที่ตรวจจับวัตถุในภาพได้ โดยใช้เทคนิคที่ทางทีมวิจัย MIT CSAIL เรียกว่า Semantic Soft Segmentation หรือ SSS

ตัวโปรแกรมตัดต่อแยกวัตถุกับพื้นหลังในรูปออกเป็นส่วนต่างๆ ที่ช่วยทำให้ง่ายต่อการเลือกวัตถุ ต่างกับเครื่องมือ magnetic lasso หรือ magic lasso ในซอฟต์แวร์ตัดต่อรูปตรงที่ตัวโปรแกรมนี้ไม่ต้องรอ input จากผู้ใช้ คุณไม่ต้องลากเส้นรอบวัตถุหรือซูมเข้าไปเพื่อเก็บรายละเอียดเล็กน้อย เพราะ AI จัดการให้เองเรียบร้อย

Credit: MIT CSAIL

เบื้องหลังของการทำงานของ AI ดังกล่าวนั้นเกี่ยวข้องกับอัลกอริธึมและการคำนวณที่ซับซ้อนจำนวนมาก ทีมวิจัยใช้โครงข่ายประสาทเทียมในการประมวลผลภาพและกำหนดเส้นขอบของภาพ เวลาคนดูภาพก็สามารถแยกภาพออกจากบริบทได้ดีและไม่ยากลำบากแต่อย่างใด แต่การจะฝึกคอมพิวเตอร์ให้ทำแบบนั้นได้นั้นนับว่าเป็นเรื่องไม่ง่ายเลยทีเดียว

Yagiz Aksoy นักวิจัยจาก MIT CSAIL เผยว่า “สิ่งหนึ่งที่ท้าทายเกี่ยวกับภาพเหล่านี้ก็คือว่า ไม่ใช่ทุกพิกเซลจะเป็นของวัตถุหนึ่งเพียงวัตถุเดียว ในหลายกรณีจึงยากที่จะระบุได้ว่าพิกเซลใดเป็นส่วนหนึ่งของพื้นหลัง และพิกเซลใดเป็นส่วนหนึ่งของบุคคลในภาพ” นั่นเป็นเพราะ soft transition ทำให้วัตถุที่ต่างกันสองชนิด หรือวัตถุกับพื้นหลัง ใช้พิกเซลบริเวณขอบวัตถุร่วมกัน ทั้งนี้ AI ของ MIT ก็คำนึงถึงเรื่องนี้และทำงานลงรายละเอียดในการแยกความต่างดังกล่าวได้ด้วยตนเอง

เทคโนโลยีนี้สามารถนำไปประยุกต์ใช้ได้หลายอย่าง ไม่ว่าจะเป็นการใช้ใน Instagram ที่ช่วยให้คุณเปลี่ยนพื้นหลังได้อย่างแนบเนียนหรือเพิ่มเอฟเฟคหน้าชัดหลังเบลอ หรือความสามารถในการนำไปปรับใช้ในวีดีโอ

AI ย่อมเป็นอนาคตของการปรับแต่งภาพและวีดีโอแน่นอน แต่เรายังไม่ถึงจุดนั้น ขั้นตอนในปัจจุบันนี้ที่ทางนักวิจัย MIT CSAIL กำลังพัฒนาอยู่นั้นยังใช้กับวีดีโอไม่ได้ และยังใช้เวลาประมาณ 4 นาทีในการประมวลผลรูปภาพ ในขณะที่ถ้าใช้ Photoshop อาจจะเร็วกว่านั้น

ข้อมูลเพิ่มเติมสามารถติดตามอ่านจากงานวิจัยของทีม CSAIL ได้