
ตามรายงานของ Financial Times เมื่อช่วงต้นสัปดาห์ที่ผ่านมา ทาง Microsoft ได้ถอดฐานข้อมูลใบหน้า MS Celeb ที่ตั้งใจให้เป็นฐานข้อมูลสำหรับเทรนและทดสอบอัลกอริทึมรู้จำใบหน้า (facial recognition) จำนวนมากกว่า 10 ล้านภาพออกไปแล้ว
โดยฐานข้อมูล MS Celeb นี้มีภาพมากกว่า 10 ล้านภาพที่รวมมาจากคนจำนวนเกือบๆ 100,000 คน ซึ่งส่วนมากเป็นการ scrap ข้อมูลมาจากแหล่งข้อมูลออนไลน์ที่เปิดสาธารณะไว้อยู่ แม้ว่าจะไม่มีภาพส่วนบุคคลในฐานข้อมูลซึ่งยากที่จะค้นหาได้ แต่จำนวนภาพมหาศาลและข้อมูลที่เก็บไว้ในนั้นทำให้ dataset นี้มีประโยชน์อย่างมากในการเทรนระบบเพื่อรู้จำใบหน้าได้จากภาพที่แตกต่างกัน
การถอดข้อมูลนี้ออกไปเกิดหลังจาก Financial Times ตรวจสอบพบว่ามีผู้คนจำนวนมากที่มีภาพใน dataset นั้นซึ่งไม่ได้ระมัดระวังเกี่ยวกับสิ่งนี้และไม่ได้มีการยินยอมให้นำภาพของตัวเองไปใช้งานได้ จึงทำให้ผู้เชี่ยวชาญจำนวนมากคาดการณ์ว่า dataset นี้น่าจะมีปัญหาในเชิงกฎหมายภายใน General Data Protection Regulation (GDPR) ซึ่งมีข้อกำหนดที่ให้ความสำคัญเกี่ยวกับความยินยอมในการจัดเก็บและแลกเปลี่ยนข้อมูลส่วนตัวอย่างมาก
อย่างไรก็ดี Microsoft ไม่ได้มีการประกาศที่จะถอดเอาข้อมูล dataset ออกไปแต่อย่างใด และได้แสดงความคิดเห็นไว้ในคอมเมนต์ต่อ Financial Times ว่า “เว็บไซต์นี้ได้มุ่งหวังเพื่อใช้ในเชิงวิชาการเท่านั้น” โฆษกกล่าว “มันเคยถูกรันโดยพนักงานคนหนึ่งซึ่งตอนนี้ไม่ได้อยู่ที่ Microsoft แล้ว จึงได้ถอดออกไป”
นอกจากนี้ ฐานข้อมูล dataset ที่ลักษณะคล้ายๆ กันของ Duke University และ Standford ก็ถอดออกไปเช่นเดียวกันแล้วหลังจากรายงานของ Financial Times
Source : https://www.theverge.com/2019/6/7/18656800/microsoft-facial-recognition-dataset-removed-privacy