AI สามารถระบุ malware ตัวใหม่เฉกเช่นเดียวกับการรู้จำแมวในภาพได้

0
https://cdn.technologyreview.com/i/images/screen-shot-2018-04-18-at-10.28.23-am.png?sw=520&cx=94&cy=63&cw=1084&ch=1082

จาก ransomware กลายมาเป็น botnet จะเห็นได้ว่า malware นั้นดูเหมือนจะเป็นสิ่งที่ไม่มีวันสิ้นสุดหรือสูญหายไปได้ และคงจะมีพบได้อย่างแพร่หลายทั่วไป ต่อให้พยายามมากแค่ไหน แรงงานคนที่จะพยายามหาทางป้องกันคอมพิวเตอร์ของพวกเราจาก malware ก็คงทยอยล้มหายตายจากไปจากการโจมตี ดังนั้น พวกเขาจึงเริ่มมาทางด้าน AI เพื่อช่วยเหลือ

หากแต่ปัญหามีเพียงอย่างเดียวคือ ระบบการเรียนรู้ของเครื่องนั้นต้องการข้อมูลจำนวนมากๆ ซึ่งหากเป็นงานทางด้านการประมวลผลภาพอย่าง Computer Vision หรือการประมวลผลภาษาธรรมชาติหรือ Natural Language Processing ก็คงไม่ได้ติดปัญหาเรื่องข้อมูลเพราะมีอยู่เป็นจำนวนมากและมีข้อมูลเผยแพร่อยู่ทั่วไปในการนำไปใช้เทรนในแต่ละอัลกอริธึม เช่นว่าภาพของแมวเป็นอย่างไร หรือว่าคำ (word) มีความสัมพันธ์กับคำอื่นๆ อย่างไร เป็นต้น หากแต่ในโลกของ malware นั้นเป็นสิ่งที่ยังไม่เคยมีข้อมูลเปิดเผยมาก่อนจนกระทั่งถึงวันนี้

หากแต่ในสัปดาห์ที่ผ่านมา บริษัท Endgame ผู้ทำด้าน cybersecurity ได้เผยแพร่ข้อมูลขนาดใหญ่ในด้านนี้แล้ว มีชื่อว่า EMBER (Endgame Malware Benchmark for Research) โดย EMBER เป็นเสมือนข้อมูลตัวแทนของไฟล์ข้อมูลไวรัสและไฟล์ข้อมูล malicious ที่เป็น executable สามารถรันบน Windows ได้ซึ่งเป็นรูปแบบที่ malware ส่วนใหญ่จะซ่อนตัวอยู่ อีกทั้ง ทีมที่บริษัทยังได้เผยแพร่ระบบ AI ที่จะสามารถถูกเทรนบนข้อมูลดังกล่าวนี้ได้ด้วย โดยหลักการแนวคิดคือถ้าหากว่าระบบ AI สามารถทำให้กลายเป็นอาวุธที่ทรงพลังในการต่อสู้กับ malware ต่างๆ ได้ ระบบก็คงต้องการรู้ว่ากำลังจะต้องเสาะหาอะไร

โดยบริษัทด้านความปลอดภัยนี้ได้มีข้อมูลที่มีศักยภาพในการนำไปใช้เทรนระบบและอัลกอริธึมต่างๆ ได้ หากแต่ว่าผู้ไม่ประสงค์ดีที่สร้าง malware ขึ้นมานั้นก็จะสามารถปรับเปลี่ยนบิดโค้ดของพวกเขาเองให้สามารถที่จะนำหน้าระบบตรวจจับได้อย่างรวดเร็วทันควัน ดังนั้นการเทรนบนข้อมูล malware ตัวอย่างนั้นเป็นสิ่งที่ล้าสมัยนั้นเหมือนเป็นการออกกำลังที่ไม่ได้ผล

EMBER นั้นจึงเป็นข้อมูลที่มุ่งหวังช่วยเหลือให้ระบบ cybersecurity ต่างๆ นั้นสามารถดำเนินการต่อไปได้ โดยแทนที่จะนำไฟล์จริงๆ ที่จะสามารถทำให้คอมพิวเตอร์ของนักวิจัยติด malware นั้นได้ EMBER จะมีลักษณะเหมือนเป็นสัญลักษณ์ (avatar) ของแต่ละไฟล์ ซึ่งจะเป็นเหมือนตัวแทนที่จะทำอัลกอริธึมหรือไอเดียลักษณะของ malware นั้นหากแต่ไม่ได้มีการทำให้เครื่องมีอาการนั้นๆ จริง

สิ่งนี้จะช่วยทำให้ community ในด้าน cybersecurity สามารถที่จะสร้างเทรนระบบและทดสอบในอัลกอริธึมต่างๆ ได้มากยิ่งขึ้น และทำให้สามารถสร้างระบบ AI ที่มีประสิทธิภาพที่ดีขึ้น ปรับตัวได้มากขึ้นในการตรวจจับ malware

และแน่นอน การสร้างข้อมูลนี้แล้วเปิดเผยให้กับใครก็ได้ในการนำไปใช้นั้น ยังเป็นการพิสูจน์ถึงความรับผิดชอบ หากมันตกไปอยู่ผิดมือ โดยคนสร้าง malware อาจใช้ข้อมูลนี้ในการสร้างระบบที่จะทำให้ระบบ AI ไม่สามารถตรวจจับได้ ปัญหานี้ที่คุณ Hyrum Anderson ตำแหน่ง Technical Director ด้าน Data Science บริษัท Endgame กล่าว โดยเขาหวังว่าประโยชน์ในการเปิดเผยข้อมูลนี้จะมีมากกว่าความเสี่ยงที่จะเกิดขึ้นได้

Source : https://www.technologyreview.com/s/610881/with-this-tool-ai-could-identify-malware-as-readily-as-it-recognizes-cats/