นักวิจัยได้เผยซอฟต์แวร์ใหม่ที่ใช้ระบบเรียนรู้ที่ทำให้ผู้ใช้ตัดต่อบทพูดในวีดีโอ ไม่ว่าจะเป็นการเพิ่ม ตัดออก หรือเปลี่ยนคำที่ออกมาจากปากของคนในคลิปได้อย่างง่ายดาย
ผลงานนี้จัดทำขึ้นโดยนักวิจัยจาก Stanford University, the Max Planck Institute for Informatics, Princeton University และ Adobe Research ซึ่งแสดงให้เห็นถึงความสามารถในการตัดต่อคำพูดในคลิปและสร้างวีดีโอปลอมสมจริงได้ง่ายขึ้นทุกที แต่งานชิ้นนี้ยังอยู่ในขั้นตอนวิจัยอยู่และยังไม่ออกเป็นซอฟต์แวร์สำหรับผู้ใช้ทั่วไป แต่ก็คงอีกไม่นานจนกว่าจะมีบริการลักษณะเดียวกันเปิดให้ใช้งานสู่สาธารณะ อย่าง Adobe เอง ก็เคยออกซอฟต์แวร์ตัวต้นแบบชื่อ VoCo ที่สามารถดัดแปลงตัดต่อเสียงบันทึกได้ง่ายเหมือนการตัดต่อภาพ
การสร้างวีดีโอปลอมขึ้นมานั้น นักวิทยาศาสตร์ใช้เทคนิคต่างๆ เข้าด้วยกัน เริ่มจากสแกนวีดีโอต้นแบบเพื่อแยกหน่วยเสียงที่คนในคลิปพูด แล้วจับคู่หน่วยเสียงเข้ากับรูปปากที่ตรงกัน สุดท้ายจึงสร้างรูปหน้าส่วนล่างของผู้พูดในคลิปแบบสามมิติออกมา เมื่อมีการแก้ไขข้อความคำพูดในวีดีโอ ซอฟต์แวร์จะรวบรวมข้อมูลที่เก็บมาทั้งหน่วยเสียง รูปปาก และโมเดลใบหน้าสามมิติ เพื่อสร้างฟุตเทจใหม่ที่ตรงกับข้อความอินพุต แล้วจึงนำไปใส่ในวีดีโอต้นฉบับเพื่อสร้างผลลัพธ์สุดท้ายออกมา
ในการทดสอบ ได้นำวีดีโอปลอมไปให้กลุ่มอาสาสมัคร 138 คนดู ซึ่งมีจำนวนผู้เข้าร่วมชมคลิปถึง 60 เปอร์เซ็นต์ที่คิดว่าเป็นคลิปจริง อย่างไรก็ดี เทคโนโลยีนี้ก็มีข้อจำกัดคือ อัลกอริธึมจะใช้งานกับวีดีโอที่แสดงเฉพาะส่วนศีรษะขณะคนในคลิปกำลังพูดอยู่ และต้องมีข้อมูลอินพุตเป็นเวลา 40 นาที นักวิจัยยังหมายเหตุอีกว่า ยังไม่สามารถเปลี่ยนอารมณ์หรือน้ำเสียงของผู้พูดได้ จึงทำให้ผลลัพธ์ดูแปลกๆ และหากมีกรณีอย่างเช่นผู้พูดโบกไม้โบกมือขณะพูด อัลกอริธึมก็จะทำงานไม่ได้เช่นกัน
ดังนั้น เทคโนโลยีนี้จึงยังไม่สมบูรณ์นัก แต่ท้ายที่สุดแล้ว ข้อจำกัดเหล่านี้มักเป็นส่วนหนึ่งของงานวิจัยในขั้นต้นและจะได้รับการแก้ไขในเวลาต่อมา ซึ่งนั่นหมายความว่า อีกไม่นานอาจจะมีซอฟต์แวร์ที่ให้ใครก็ได้แก้สิ่งที่คนในคลิปพูดโดยไม่ต้องผ่านการฝึกฝนเฉพาะทางเลย
เทคโนโลยีลักษณะนี้มีประโยชน์หลายด้าน เช่น สามารถช่วยวงการภาพยนตร์และโทรทัศน์ในการแก้บทพูดที่ผิดได้โดยไม่ต้องบันทึกเทปใหม่ และสร้างการพากย์ที่แนบเนียนขึ้นเมื่อนักแสดงพูดคนละภาษา แต่แน่นอนว่าเทคโนโลยีนี้ก็อาจนำไปใช้ผิดวัตถุประสงค์ได้