สถาบัน Allen Institute for AI จับมือกับกลุ่มวิจัยทั่วโลกเปิด Open Data ชุดข้อมูล COVID-19 Open Research Dataset (CORD-19) ที่รวบรวมบทความวิชาการเกี่ยวกับ COVID-19 มากกว่า 47,000 บทความ เพื่อให้นักวิจัยทั่วโลกนำไปศึกษาต่อด้วยเทคนิค Natural Language Processing
Allen Institute for AI กล่าวว่าจุดประสงค์ของการเปิดชุดข้อมูลดังกล่าวขึ้นก็เพื่อให้นักวิจัยได้ใช้เทคโนโลยีการประมวลผลภาษาธรรมชาติที่มีประสิทธิภาพสูงขึ้นในปัจจุบันในการหา Insights ที่มีประโยชน์ต่อการต่อสู้กับโรค COVID-19 โดยทางสถาบันจะอัพเดทบทความวิชาการเพิ่มเข้าไปในชุดข้อมูลนี้ทุกสัปดาห์ จากบทความที่ได้รับการตีพิมพ์ในวารสาร Peer-reviewed และบริการเช่น bioRxiv, medRxiv และบริการอื่นๆที่คล้ายกัน
โดยในการนี้ Kaggle ก็ได้เปิดการแข่งขันใหม่ โดยให้ผู้ร่วมแข่งขันใช้ชุดข้อมูล CORD-19 ดังกล่าวเพื่อหาคำตอบให้กับคำถามที่กำหนดไว้ เช่น มีบทความใดบ้างที่เกี่ยวข้องกับประเด็นการพิจารณาด้านจริยธรรมและสังคมศาสตร์ และ เรารู้อะไรบ้างเกี่ยวกับรหัสพันธุกรรมของไวรัส ยีนส์ และการวิวัฒนาการของมัน เป็นต้น โดย Kaggle มีเงินรางวัลมูลค่า 1,000 เหรียญสหรัฐให้กับผู้ที่สามารถตอบคำถามในข้อนั้นๆได้ตรงตามเกณฑ์มากที่สุด
การแข่งขันนี้ แบ่งออกเป็น 2 รอบ ในรอบแรกปิดรับคำตอบในวันที่ 16 เมษายน และรอบที่สองในวันที่ 16 มิถุนายน มีเงินรางวัลให้แยกกันในแต่ละรอบ และผู้ที่เคยได้รางวัลแล้วสามารถได้ซ้ำหากพิจารณาแล้วว่าผลงานมีความก้าวหน้าจากผลงานในรอบแรก
ผู้ที่สนใจชุดข้อมูลดังกล่าวสามารถเข้าไปดาวน์โหลดได้ที่ https://pages.semanticscholar.org/coronavirus-research หรือลองดูข้อมูลด้วยเครื่องมือ Explorer ใน CORD-19 Explorer