IBM มากับลายน้ำสำหรับโครงข่ายประสาทเทียม

0
https://cdn0.tnwcdn.com/wp-content/blogs.dir/1/files/2018/07/AI-watermark-796x448.jpg

ในการสร้างสรรค์และพัฒนาระบบโครงข่ายประสาทเทียมให้มีความทนทาน (robust) นั้นเป็นงานที่ต้องใช้แรงงานอย่างมากและต้องใช้เวลาในการดำเนินการด้วยความพยายามอย่างมาก และนี่คือเหตุผลที่ทีมนักวิจัยของ IBM ได้พัฒนาวิธีการสำหรับนักพัฒนาระบบ AI เพื่อป้องกันงานอันเป็นทรัพย์สินทางปัญญา (intellectual property) ของตัวเองได้

ลักษณะจะเหมือนกับการใส่ลายน้ำลงไป โดยจะมีการฝังข้อมูลบางอย่างลงไปในโครงข่ายซึ่งจะมีความสามารถมากกว่าแค่การ trigger ขึ้นมาเพื่อวัตถุประสงค์ในการระบุตัวตน โดยถ้าหากว่าคุณใช้เวลาหลักหลายร้อยชั่วโมงในการสร้างและเทรนโมเดล AI ขึ้นมาแล้วมีใครบางคนตัดสินใจที่จะขโมยงานของคุณไป เทคนิคใหม่ของ IBM นี้จะช่วยให้คุณสามารถพิสูจน์ได้ว่าโมเดลนั้นเป็นของคุณ

วิธีการของ IBM นั้นจะเกี่ยวข้องกับการฝังข้อมูลที่เฉพาะเจาะจงลงไปในโมเดล deep learning และจากนั้นก็จะมีการตรวจจับข้อมูลเหล่านั้นโดยให้ข้อมูลภาพภาพหนึ่งเข้าไปในโครงข่ายประสาทเทียม (Neural Network) เพื่อที่จะ trigger ผลการตอบสนองที่ผิดปกติออกมา ซึ่งสิ่งนี้ทำให้นักวิจัยสามารถที่จะสกัด (extract) ลายน้ำออกมาและสามารถพิสูจน์ความเป็นเจ้าของของโมเดลนั้นๆ ได้ และตามในบล็อคโพสของ IBM เทคนิคการทำลายน้ำนี้ได้ถูกออกแบบมาเพื่อให้ใครที่ไม่ประสงค์ดีนั้นจะไม่สามารถที่จะแค่เปิดโค้ดแล้วลบลายน้ำออกไปได้ง่ายๆ

“ลายน้ำที่ฝังอยู่ในโมเดล deep learning นั้นมีความทนทาน และยืดหยุ่นต่อกลไกการสร้างลายน้ำแบบต่างๆ อย่างเช่น fine-tuning, parameter pruning, และการทำ model inversion attack”

น่าสนใจอย่างยิ่ง เพราะลายน้ำนั้นไม่ได้เพียงแค่การเพิ่มโค้ดลงไปให้มีความสามารถเพิ่มเติมแล้วสิ้นเปลืองทรัพยากร (resource) เพิ่มไปอีก เพราะเรื่องทรัพยากรนั้นเป็นสิ่งที่สำคัญเนื่องจากว่าโครงข่ายประสาทเทียมนั้นจะสามารถใช้ทรัพยากรเพิ่มขึ้นไปได้อย่างมหาศาล แต่คุณ March Ph. Stoecklin ผู้จัดการ และ Cognitive Cybersecurity Intelligence แห่ง IBM Research และผู้ร่วมเขียนงานตีพิมพ์ของโครงการนี้กล่าวว่าสิ่งนี้ไม่ใช่ประเด็น “สิ่งนี้ไม่ได้มีกระทบกับกระบวนการทำ classification พวกเราสังเกตเห็นถึง overhead ที่เล็กน้อยมากระหว่างกระบวนการเทรนโมเดล (เวลาสำหรับเทรนยังคงต้องมี) นอกจากนี้ พวกเรายังสังเกตเห็นผลกระทบเล็กน้อยกับความถูกต้อง (accuracy) ของโมเดลที่ลดลงไปนิดหน่อย (โมเดลที่ไม่มีลายน้ำได้ความถูกต้อง 78.6% ถ้าใส่ลายน้ำลงไปได้ความถูกต้อง 78.41% ในการทำ image recognition ที่ทดสอบบนข้อมูลชุด CIFAR10)”

โครงการนี้ยังคงอยู่ในช่วงเริ่มต้น แต่ IBM ก็ได้วางแผนที่จะใช้เทคนิคดังกล่าวนี้ภายใน โดยมีมุมที่จะพัฒนาเพื่อขายเชิงพาณิชย์ต่อไป

Source : https://thenextweb.com/artificial-intelligence/2018/07/20/ibm-came-up-with-a-watermark-for-neural-networks/