นักพัฒนาจากบริษัทไม่แสวงหาผลกำไร OpenAI ได้ประกาศถึงระบบโครงข่ายประสาทเทียม deep learning neural network 5 ระบบที่พวกเขาเรียกกันว่า “OpenAI Five” ได้สามารถเอาชนะทีมมือสมัครเล่นในเกมการแข่งกันต่อสู้ใน arena ยอดนิยมอย่าง Dota 2 ได้แล้ว
“OpenAI Five จะเล่นเกมแข่งขันกับตัวเองเป็นเวลาในเกม 180 ปีในทุกๆ วัน โดยเรียนรู้ที่จะเล่นด้วยตัวเอง โดยมันจะเทรนโดยใช้เวอร์ชันที่มีขนาดที่ใหญ่ขึ้นของอัลกอริทึม Proximal Policy Optimization (PPO) โดยรันบน GPU 256 ตัวและ CPU 128,000 core” ทีมงานเขียนในบล็อคโพส “โดยการใช้ระบบความจำสั้นแบบยาว (Long Short Term Memory หรือ LSTM) ที่แยกกันในแต่ละ hero (คือตัวละครที่ระบบ AI หรือผู้เล่นจะควบคุม) และไม่มีข้อมูลมนุษย์ ระบบจะเรียนรู้ในการเข้าใจกลยุทธ์ต่างๆ ได้ สิ่งนี้แสดงให้เห็นว่าการเรียนรู้แบบ reinforcement learning สามารถให้ผลผลิตในการวางแผนระยะยาวด้วยขนาดใหญ่แต่เป็นขนาดที่สามารถทำได้ โดยไม่ต้องมีข้อมูลพื้นฐานมาก่อน ซึ่งจะตรงกันข้ามกับสิ่งที่พวกเราคาดหวังไว้ตอนเริ่มต้นโครงการนี้”
ด้วยการใช้ Google Cloud และ NVIDIA Tesla P100 GPU ทีมงานจึงเทรนระบบโครงข่ายประสาทเทียมบนข้อมูลระดับหลายล้านชั่วโมงของเกม ซึ่งโครงข่ายสามารถที่จะเล่นเกมแข่งกับตัวเองได้ถึง 180 ปีเวลาในเกมได้ทุกๆ วัน และเมื่อนับแยกกันของแต่ละระบบ AI นั้นก็จะรวมได้ถึง 900 ปีเวลาในเกมต่อวัน
Dota 2 ได้ถูกพัฒนามาร่วมทศวรรษและยังคงได้รับการอัพเดทในทุกๆ 2 สัปดาห์นั่นแปลว่าสภาพแวดล้อมภายในเกมนั้นยังคงมีการเปลี่ยนแปลงอยู่บ่อยๆ ซึ่งเป้าหมายของนักพัฒนาระบบคือการเอาชนะทีมนักแข่งขันเกมระดับ top professional ภายในเดือนสิงหาคมนี้ที่การแข่งขัน Dota 2 eSports tournament ประจำปี
“พวกเราอาจจะทำไม่สำเร็จ เนื่องจาก Dota 2 เป็นหนึ่งในเกมที่มีความนิยมมากๆ และเป็นเกม eSport ที่มีความซับซ้อน ด้วยความคิดสร้างสรรค์และแรงจูงใจจึงทำให้ผู้เชี่ยวชาญต่างๆ ต้องเทรนในรอบปีเพื่อที่จะได้เข้าเป็นส่วนหนึ่งของรางวัลที่มีมูลค่ารวม 40 ล้านดอลลาร์สหรัฐ (ซึ่งเป็นขนาดที่ใหญ่ที่สุดในเกมของ eSport)” ทีมงานวิจัยกล่าว
“โดยงานนี้สร้างบน 1v1 bot ซึ่งทั้งสองโครงข่ายประสาทเทียมได้เรียนรู้จากการเล่นเกมด้วยตัวเองทั้งหมด ซึ่งจะเริ่มด้วย parameter ที่สุ่มขึ้นมาและไม่ได้สืบค้นหรือใส่ข้อมูลการเล่นของคนเข้าไปแต่อย่างใด” ทีมงานกล่าว
Source : https://news.developer.nvidia.com/ai-learns-to-play-dota-2-with-human-precision/