AI ตรวจจับบทความหรือทวีตที่เขียนด้วย AI

0

นักวิจัยจาก Harvard University และ MIT-IBM Watson Lab ได้สร้างเครื่องมือ AI ชื่อว่า Giant Language Model Test Room (GLTR) ที่ใช้ตรวจจับข้อความที่สร้างขึ้นด้วย AI

สมัยนี้ AI และโมเดลสร้างภาษาธรรมชาติถูกนำมาใช้ในการเขียนข่าวปลอมหรือแพร่ข้อมูลผิดๆ GLTR จึงน่าจะเป็นเครื่องมือที่มีศักยภาพพอในการเป็นอีกหนึ่งตัวช่วยสำหรับผู้อ่านที่ไม่ใช่ผู้เชี่ยวชาญในการแยกแยะระหว่างข้อความที่ระบบสร้างขึ้นออกจากข้อความที่คนเขียนเอง ซึ่งจากผลลัพธ์ที่นักวิจัยเปิดเผยนั้น GLTR พัฒนาอัตราการตรวจพบข้อความเท็จในระดับความสามารถของมนุษย์จาก 54 เปอร์เซ็นต์ ขึ้นมาเป็น 72 เปอร์เซ็นต์ โดยไม่ได้ผ่านการฝึกมาก่อน

อัลกอริธึมนี้ใช้ประโยชน์จากการกระจายคำตามสถิติในตัวบทความเพื่อระบุชี้ความแตกต่าง หากเป็นข้อความที่สร้างขึ้นโดยระบบโมเดลภาษา ในข้อความนั้นจะมีชุดคำที่คาดการณ์ได้มากกว่าข้อความที่คนเขียนเอง

ประโยคที่สร้างขึ้นด้วย AI text generator อาจจะถูกไวยากรณ์ แต่ไม่ได้มีความหมายตามนั้น ระบบ GLTR จึงทำงานโดยระบุรูปแบบทางสถิติและเปรียบเทียบดูการเรียงคำที่คาดเดาได้ คำที่มีแนวโน้มว่าจะปรากฏขึ้นตามสถิติหลังคำก่อนหน้านี้จะเน้นสีเขียว ส่วนคำที่มีแนวโน้มน้อยลงมาก็จะเน้นคำเป็นสีเหลืองและสีแดง และคำที่มีแนวโน้มปรากฏขึ้นมาน้อยที่สุดจะเน้นคำเป็นสีม่วง

บทความจาก Love and Friendship ของ Jane Austen

หลักการคือ หากเป็นข้อความที่คนเขียนจะมีสีต่างๆ ผสมกัน ทั้งสีเหลือง แดง และม่วง แต่หากในข้อความส่วนใหญ่ถูกเน้นด้วยสีเขียวและเหลืองนั้น ก็เป็นตัวชี้วัดได้ว่าข้อความนั้นอาจเขียนขึ้นด้วยระบบเอง

ข้อความที่สร้างขึ้นโดย AI

แนวคิดอย่าง GLTR นี้มีคุณค่าไม่เพียงแค่ใช้ตรวจจับข้อความปลอมเท่านั้น แต่ยังใช้ตรวจจับบอตใน Twitter ที่เคยถูกใช้เพื่อป่วนขั้นตอนการเลือกตั้งในสหรัฐและที่อื่นมาก่อนด้วย แต่ถึงแม้ว่าวิธีนี้อาจจะยังไม่ได้ป้องกันการหลอกลวงได้แบบ 100% แต่ก็เป็นการเน้นย้ำถึงความจำเป็นในการสร้างระบบที่ให้คนกับ AI ทำงานร่วมกันเพื่อรับมือกับปัญหาที่เกี่ยวข้องกับสังคมเทคโนโลยีนี้