Microsoft ถอด dataset สำหรับทำระบบรู้จำใบหน้าออกไปหลังจาก Financial Times ตรวจสอบ

0
https://cdn.vox-cdn.com/thumbor/O13Rl4G_Kb4YSsGIWACAnDohfhA=/0x0:2040x1360/920x613/filters:focal(857x517:1183x843)/cdn.vox-cdn.com/uploads/chorus_image/image/60392425/acastro_180507_1777_microsoft_0003.0.jpg

ตามรายงานของ Financial Times เมื่อช่วงต้นสัปดาห์ที่ผ่านมา ทาง Microsoft ได้ถอดฐานข้อมูลใบหน้า MS Celeb ที่ตั้งใจให้เป็นฐานข้อมูลสำหรับเทรนและทดสอบอัลกอริทึมรู้จำใบหน้า (facial recognition) จำนวนมากกว่า 10 ล้านภาพออกไปแล้ว

โดยฐานข้อมูล MS Celeb นี้มีภาพมากกว่า 10 ล้านภาพที่รวมมาจากคนจำนวนเกือบๆ 100,000 คน ซึ่งส่วนมากเป็นการ scrap ข้อมูลมาจากแหล่งข้อมูลออนไลน์ที่เปิดสาธารณะไว้อยู่ แม้ว่าจะไม่มีภาพส่วนบุคคลในฐานข้อมูลซึ่งยากที่จะค้นหาได้ แต่จำนวนภาพมหาศาลและข้อมูลที่เก็บไว้ในนั้นทำให้ dataset นี้มีประโยชน์อย่างมากในการเทรนระบบเพื่อรู้จำใบหน้าได้จากภาพที่แตกต่างกัน

การถอดข้อมูลนี้ออกไปเกิดหลังจาก Financial Times ตรวจสอบพบว่ามีผู้คนจำนวนมากที่มีภาพใน dataset นั้นซึ่งไม่ได้ระมัดระวังเกี่ยวกับสิ่งนี้และไม่ได้มีการยินยอมให้นำภาพของตัวเองไปใช้งานได้ จึงทำให้ผู้เชี่ยวชาญจำนวนมากคาดการณ์ว่า dataset นี้น่าจะมีปัญหาในเชิงกฎหมายภายใน General Data Protection Regulation (GDPR) ซึ่งมีข้อกำหนดที่ให้ความสำคัญเกี่ยวกับความยินยอมในการจัดเก็บและแลกเปลี่ยนข้อมูลส่วนตัวอย่างมาก

อย่างไรก็ดี Microsoft ไม่ได้มีการประกาศที่จะถอดเอาข้อมูล dataset ออกไปแต่อย่างใด และได้แสดงความคิดเห็นไว้ในคอมเมนต์ต่อ Financial Times ว่า “เว็บไซต์นี้ได้มุ่งหวังเพื่อใช้ในเชิงวิชาการเท่านั้น” โฆษกกล่าว “มันเคยถูกรันโดยพนักงานคนหนึ่งซึ่งตอนนี้ไม่ได้อยู่ที่ Microsoft แล้ว จึงได้ถอดออกไป”

นอกจากนี้ ฐานข้อมูล dataset ที่ลักษณะคล้ายๆ กันของ Duke University และ Standford ก็ถอดออกไปเช่นเดียวกันแล้วหลังจากรายงานของ Financial Times

Source : https://www.theverge.com/2019/6/7/18656800/microsoft-facial-recognition-dataset-removed-privacy