Google เผยจ้างช่างภาพมืออาชีพเพื่อช่วยฝึกฝนกล้องถ่ายภาพปัญญาประดิษฐ์ Clips

0

Google Clips ทำได้อย่างไรที่จะเรียนรู้ในการเป็นกล้องถ่ายภาพที่มีความสามารถปัญญาประดิษฐ์ (AI) ที่สามารถบันทึกภาพช็อตที่ดีที่สุดสำหรับผู้ใช้งานได้อย่างอัตโนมัติ ซึ่งตามที่บริษัทได้อธิบายใน blog นั่นก็คือการจ้างผู้อำนวยการสร้างภาพยนตร์สารคดี (documentary filmmaker) นักถ่ายภาพวารสาร (photojournalist) และช่างภาพงานวิจิตรศิลป์ (fine arts photographer) เพื่อมาสร้างข้อมูลภาพสำหรับใช้ฝึกฝนโครงข่ายประสาทเทียม (Neural Network) ที่จะติดไปกับกล้องด้วยนั่นเอง

ในบล็อคได้อธิบายถึงรายละเอียดของกระบวนการนี้เล็กน้อย ซึ่งก็เป็นวิธีการทั่วไปของการสร้างปัญญาประดิษฐ์สำหรับงานลักษณะนี้ โดยการสร้างซอฟต์แวร์ที่จะรู้จำได้ว่าภาพใดคือภาพที่ดีหรือไม่ดีนั้น ก็ใช้วิธีใส่ข้อมูลสอนเข้าไปมากๆ เพื่อใช้ในการฝึกฝน (training) ซึ่งนักพัฒนาระบบคิดว่าสิ่งที่ได้มาจะไม่ใช่การตัดสินจากจุดที่ชัดเจนมากๆ เท่านั้น เช่น ภาพที่ไม่ดีคือมีส่วนที่เบลอไม่ชัด หรือภาพที่มีอะไรมาบังเลนส์กล้อง เป็นต้น หากแต่มีเกณฑ์อื่นๆ อีกและยังจับต้องได้ด้วย เช่น เวลา โดยฝึกฝน Clips พร้อมกับกฎที่ว่า “อย่าทำแบบเดิมนานเกินไปหากไม่สามารถ capture อะไรสักอย่างได้เลย”

https://cdn.vox-cdn.com/thumbor/Bqzc22pxkF_7sEZgBS6QiIyJqvw=/0x0:1200×400/720×0/filters:focal(0x0:1200×400):gifv():no_upscale()/cdn.vox-cdn.com/uploads/chorus_asset/file/10101725/UX_of_AI_inline_005.gif

 

ในการฝึกสอน Clips ที่จะรู้จำภาพที่ดีพร้อมกับให้หน้าจอการใช้งานรู้สึกว่าเป็นธรรมชาติมากที่สุดนั้น Google แจงว่า Clips ได้ถูกฝึกฝนจากสิ่งที่เรียกว่า “การออกแบบโดยคำนึงถึงมนุษย์ (human-centered design)” ซึ่งก็คือพยายามสร้างผลิตภัณฑ์ AI ที่ให้มนุษย์ใช้งานได้ได้โดยไม่เกิดความตึงเครียดใดๆ เพิ่มเติม อย่างไรก็ดี Google ยังยอมรับว่าการฝึกฝนโปรแกรม AI ในลักษณะนี้ยังคงสามารถที่จะได้ผลลัพธ์ที่ไม่ถูกต้องได้อยู่ ซึ่งต่อให้คุณใส่ข้อมูลเพื่อฝึกฝนไปมากแค่ไหนลงไปใน AI ก็ตาม สิ่งที่ AI ทำได้ก็ไม่ได้รู้จริงๆ ว่าภาพไหนคือเป็นภาพที่มีมูลค่า คุณค่า หรือ value มากที่สุดสำหรับตัวผู้ใช้ สิ่งที่ AI ทำได้อาจเป็นแค่สามารถรู้จำการจัดวางภาพที่ดี โฟกัสถูกต้อง แสงสว่างโอเค แต่ก็คงจะไม่รู้ว่าภาพที่เบลอแต่เป็นรูปลูกของคุณฝึกขี่จักรยานครั้งแรกนั้นมีคุณค่าเช่นกัน

“ระบบการเรียนรู้ของเครื่อง (Machine Learning) นั้นไม่เหมือนกับการพัฒนาซอฟต์แวร์แบบดั้งเดิม เพราะจะไม่มีทางที่ระบบจะไม่มีบั๊ก เนื่องจากการทำนายผลด้วยการเรียนรู้ของเครื่องนั้นเป็นความรู้ที่มีความคลุมเครือมาตั้งแต่แรกอยู่แล้ว” ผู้เขียนบล็อคกล่าว

Source : https://www.theverge.com/2018/1/26/16935658/google-clips-ai-camera-training-data