NVIDIA เปิดตัวบริการใหม่ “NeMo” และ “BioNeMo” รับเทรนโมเดลขนาดใหญ่ภายในไม่กี่ชั่วโมง

September 22, 2022

การมาถึงของโมเดลภาษาขนาดใหญ่ (Large Language Models : LLMs) ในวงการ AI อย่างเช่น GPT-3 จากทาง OpenAI นั้น ได้ทำให้การพัฒนาโมเดล AI นั้นมีความชาญฉลาดมากยิ่งขึ้นอย่างก้าวกระโดด ซึ่ง NVIDIA ดูเหมือนว่าจะเห็นโอกาสในเรื่องนี้และไม่รีรอแต่อย่างใด ล่าสุด จากงาน GTC Conference ทาง NVIDIA จึงได้เปิดตัว “NeMo LLM Service” และ “BioNeMo LLM Service” ออกมา

ทั้งสองนั้นคือส่วนหนึ่งของ NVIDIA NeMo (ย่อมาจาก Neural Modules) ชุดเครื่องมือ (Toolkit) ที่ปล่อย Opensource ออกมาก่อนหน้านี้ สำหรับใช้ทำระบบ AI สนทนา (Conversational AI) เพื่อสนับสนุนให้นักพัฒนาระบบ เพื่อสร้าง LLMs ได้จากเริ่มต้น

โดยปกตินั้น การสร้าง LLMs ขึ้นมามักจะมีราคาในการพัฒนาและเทรนค่อนข้างสูง อย่างเช่น การสร้างโมเดล PaLM ของ Google ผ่านทรัพยากร Cloud Computing สาธารณะที่ตีราคาแล้วอยู่ที่ราว ๆ 9 – 23 ล้านดอลลาร์สหรัฐเลยทีเดียว

ดังนั้น NVIDIA จึงมองเห็นโอกาส เลยเปิดบริการ “NeMo LLM Service” และ “BioNeMo LLM Service” เพื่อบริการเทรนโมเดลภาษาขนาดใหญ่ให้ ที่สามารถประยุกต์สร้างระบบ AI ที่มีขนาดตั้งแต่ 3 – 530 พันล้านตัวแปร ให้สามารถใช้งานได้เลยภายในไม่กี่ชั่วโมงเท่านั้น (ถ้าตัวแปรน้อยอาจจะอยู่ที่หลักนาที) พร้อมปรับแต่งแบบ No Code ภายหลังได้ทันทีด้วย

สำหรับ NeMo LLM Service นั้นจะเป็นบริการสร้างระบบ AI ที่สามารถนำไปประยุกต์ใช้ได้ในหลากหลาย Use Case เช่น การสร้างข้อความ (Text Generation) หรือสรุปความ (Text Summarization) รวมทั้งสามารถปรับแต่งโมเดลด้วยเทคนิค Prompt Learning ที่เปลี่ยนโดเมนการใช้งานโมเดลที่เทรนมาได้อย่างรวดเร็ว

ส่วน BioNeMo LLM Service จะเน้นสำหรับเรื่องวิทยาศาสตร์สิ่งมีชีวิต (Life Science) เช่นเรื่องการทำนายโครงสร้างโปรตีน โดยเริ่มต้นจะมี Pretrained Model 4 ตัวให้เลือกใช้งานได้ ซึ่งในนั้นจะมีโมเดลจาก Meta AI Labs แผนก R&D ของ Meta ด้วย

เรียกว่าเป็นการเคลื่อนไหวของวงการ AI ที่น่าสนใจ ซึ่งอนาคตไม่แน่ว่าการสร้าง LLMs ขึ้นมาอาจจะมีต้นทุนที่ต่ำลงไปได้อีก ด้วยเทคโนโลยีและวิวัฒนาการของโมเดล AI ที่ก็ไม่แน่ว่าโมเดลใหม่ที่จะมาแทน GPT-3 นั้นอาจจะมาเร็วกว่าที่คิดก็เป็นได้

ที่มา: https://techcrunch.com/2022/09/20/nvidia-launches-new-services-for-training-large-language-models/

Share this: