สำหรับตัวละครในอนิเมชันที่โลดแล่นในจอภาพที่ทำให้พวกเรามีความสุขที่ได้รับชมนั้น การสร้างตัวละครให้มีชีวิตชีวาสมจริงนั้นไม่เคยเป็นงานที่ง่ายแต่อย่างใด ด้วยเทคโนโลยี motion capture เป็นการบันทึกการเคลื่อนไหวของคนและจำลองแบบดิจิทัลในการสร้างอนิเมชันสามมิติออกมา ซึ่งปัญหาคือวิธีการทำ motion capture ด้วยวิธีแบบดั้งเดิมนั้นจะมีค่าใช้จ่ายสูงมากและต้องใช้อุปกรณ์จำนวนมาก และต้องใช้ทักษะความเชี่ยวชาญในการเซ็ตอัพกล้องหลายๆ ตัวที่จะทำงานพร้อมกัน อีกทั้งสภาพแวดล้อมในสตูดิโอ และเซ็นเซอร์พิเศษที่ใส่ลงไปในชุดของนักแสดง จึงทำให้เกิดสตาร์ทอัพ RADiCAL ที่จะลดปัญหาเหล่านี้ลงไป
ตัวอย่างวิธีการทำ motion capture แบบดั้งเดิม เช่นผลงานของคุณ Andy Serkis ที่สามารถสร้างกอลลัมในภาพยนตร์ซีรีย์ Lord of the Rings
“ค่าใช้จ่าย ทักษะ และเวลา เหล่านั้นเป็นสิ่งที่หลีกเลี่ยงได้” คุณ Gaven Gravensen ผู้ก่อตั้งและ CEO บริษัท RADiCAL ซึ่งเป็นหนึ่งในสมาชิกของโปรแกรม NVIDIA Inception ที่สำหรับบริษัทสตาร์อัพจะเปลี่ยนแปลงสิ่งดั้งเดิมไป “พวกเรามุ่งเน้นไปในการส่งมอบทั้งความพร้อมใช้งานแบบสากล เชื่อมต่อกันได้อย่างไร้รอยต่อ และทำได้อย่างรวดเร็ว ทั้งหมดนี้ด้วยราคาที่ต่ำ” เขากล่าว
ด้วยโซลูชันของบริษัทที่ใช้ความสามารถของระบบ AI และใช้ GPU NVIDIA นั้น จะต้องการเพียงนักพัฒนาเกม (game developer) นักออกแบบกราฟฟิกส์สามมิติ (3D graphics artists) ผู้สร้างภาพยนตร์ (filmmaker) และผู้ที่สนใจด้าน AR/VR ที่มีอุปกรณ์เพียงกล้องสองมิติซึ่งอาจจะเป็นเพียงแค่สมาร์ทโฟน โดยที่ไม่ต้องการอุปกรณ์ฮาร์ดแวร์อื่นๆ สตูดิโอหรือเซ็นเซอร์แบบละเอียดแต่อย่างใด สิ่งนี้จะช่วยลดค่าใช้จ่ายและแรงงานลงไปได้อย่างมหาศาล
โดยผู้ใช้ในโลกใบนี้สามารถอัพโหลดวีดีโอผ่านทางสมาร์ทโฟนหรือผ่านเว็บไซต์ได้โดยตรงไปที่คลาวด์ของ RADiCAL ซึ่งบริษัทจะประมวลผลวีดีโอโดยใช้ระบบ AI และ motion science ในการตรวจจับสิ่งที่อยู่ในวีดีโอที่เสมือนเป็นการเคลื่อนไหวของคนในโลกสามมิติ และสร้างสิ่งที่กล้องมองไม่เห็นได้อีกด้วย
ด้วยอัลกอริทึมที่สามารถปรับเข้ากับสัดส่วนร่างกายและการเคลื่อนไหวของคนที่แตกต่างกันได้ และสามารถสร้างโมเดลที่จำลองเสมือนกับการเคลื่อนไหวในวีดีโอในโลกสามมิติ ซึ่งกระบวนการในการดำเนินการดูง่ายและโมเดลที่ได้มาก็ยังดูไหลลื่นอีกด้วย
ในการพัฒนาระบบ AI สิ่งแรกที่ท้าทาง RADiCAL เป็นอย่างแรกคือการเลี่ยงการประมวลผลข้อมูลขนาดใหญ่มาก โดยการประมวลผลเพียง 1 ภาพนิ่งจะต้องวิเคราะห์ข้อมูลถึง 6 GB ซึ่งใน 1 วินาทีของการเคลื่อนไหวจะต้องประมวลผลถึง 120 เฟรม ซึ่งเท่ากับข้อมูล 720 GB เลยทีเดียว
นอกจากนี้ทางคุณ Bellini และทีมงานเลือกที่จะใช้เฟรมเวิร์ก TensorFlow ในการประมวลผลบน GPU และเลือก “โมเดลประมวลผลครั้งเดียว (single execution model)” สำหรับทั้ง pipeline อีกทั้งใช้ ad-hoc kernel ที่เขียนเพื่อให้ CUDA เสริม TensorFlow ได้ดียิ่งขึ้น และเพื่อให้รองรับโมเดลการเคลื่อนไหวได้ RADiCAL พัฒนาเป็นระบบ multi-GPU เพื่อให้สามารถประมวลผลได้หลายเฟรม ซึ่งจากการใช้คลาวด์ที่รองรับ multi-GPU ได้ จึงทำให้คุณ Bellini และทีมสามารถลดรอบเวลาในการพัฒนาจนกระทั่ง production ได้ถึง 10 เท่า
โดยเมื่อวีดีโอประมวลผลเสร็จสิ้น RADiCAL จะแสดงให้เห็นตัวอย่าง 3D motion แบบเทียบกับวีดีโอจริง ซึ่งผู้ใช้สามารถดาวน์โหลดไฟล์อนิเมชันออกมาแล้วพร้อมใช้งานได้ทันทีในหลายๆ รูปแบบ ซึ่งตอนนี้ RADiCAL ได้เปิดให้ใช้งานแบบ beta ก่อนที่เปิดเป็น commercial ต่อไปภายในไม่กี่สัปดาห์นี้
Source : https://blogs.nvidia.com/blog/2018/05/08/radical-3d-motion-capture/