หลังจาก OpenAI มีผลิตภัณฑ์เรือธงอย่าง ChatGPT ที่พลิกโลกทั้งใบให้หันมาสนใจในเรื่อง Generative AI กันแทบทั้งหมดจนทำให้มีคู่แข่งเกิดขึ้นมามาย อาทิ Bard (ปัจจุบันคือ Gemini) หรือ Claude
หากแต่อีกหนึ่งเจ้าที่โดดเด่นอย่างมากและน่าจับตาอย่างยิ่งคือ “Mistral AI” สตาร์ตอัปอายุราวแค่ 1 ปีเท่านั้น แต่ได้จับมือกับบริษัทยักษ์ใหญ่ระดับโลกอย่าง Google Cloud, IBM, Microsoft และอื่น ๆ อีกมากมายแล้วเรียบร้อยภายในช่วงเวลาไม่กี่เดือนที่ผ่านมาเท่านั้น
Mistral AI คือใคร มีผลิตภัณฑ์อะไรบ้าง ติดตามได้ในบทความนี้
Mistral AI คือใคร
Mistral AI คือบริษัทสตาร์ตอัปสัญชาติฝรั่งเศสที่ก่อตั้งโดยอดีตนักวิจัยจาก Meta AI คุณ Guillaume Lample และ Timothée Lacroix ร่วมกับนักวิจัยจาก Google DeepMind คุณ Arthur Mensch โดยบริษัทเพิ่งก่อตึั้งเมื่อวันที่ 28 เมษายน 2023 ที่ผ่านมานี้เอง ซึ่งนับจนถึงวันนี้มีอายุยังไม่ครบ 1 ปีบริบูรณ์เลย
โดย Mistral AI นั้นเป็นบริษัทที่มุ่งเน้นพัฒนาผลิตภัณฑ์เทคโนโลยี AI สำหรับนักพัฒนาระบบเป็นหลัก ซึ่งปัจจุบันได้มีปล่อยโมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) ออกมาให้เป็น Open Source และโมเดลแบบ Commercial เชิงพาณิชย์ที่สามารถสนับสนุนได้ในหลากหลาย Use Case ซึ่งถือได้ว่าเป็นอีก LLM ที่มาแข่งขันกับตลาด Generative AI อันร้อนแรงอย่าง GPT-4 ของ OpenAI หรือ Gemini ของ Google
และในช่วงปลายปี Mistral AI ได้ประกาศว่าสามารถระดมทุนได้ถึง 385 ล้านยูโร (ราว 428 ล้านดอลลาร์สหรัฐ) ซึ่งเป็นส่วนหนึ่งของการระดมทุนครั้งที่ 2 ของบริษัท โดยมี NVIDIA และ Salesforce เป็นผู้ร่วมลงทุนในนั้นด้วย
ผลิตภัณฑ์ของ Mistral AI
ปัจจุบัน Mistral AI มีผลิตภัณฑ์ AI อยู่หลากหลายรูปแบบทั้งที่เป็นแบบ Commercial และ Open Source อาทิ
- Mistral 7B โมเดลแรกของบริษัทที่เปิดเป็น Open Source โดยเป็นโมเดล Transformer ขนาด 7 พันล้านพารามิเตอร์ (7B) ที่มีความฉลาดในภาษาอังกฤษและการเขียนโค้ด โดยใช้กรอบบริบท (Context Window) ที่ 8k
- Mixtral 8x7B โมเดล Open Source ที่ดีที่สุดของ Mistral ปัจจุบัน ซึ่งเป็นโมเดลที่ใช้เทคนิค Sparse Mixture-of-Experts (SMoE) ขนาด 7B ที่ทำให้มีความเชี่ยวชาญในหลากหลายภาษา เช่น ภาษาอังกฤษ ฝรั่งเศส อิตาเลียน เยอรมัน สเปน รวมทั้งการเขียนโค้ด โดยใช้ Context Window ถึงขนาด 32k
- Mistral Small โมเดลระดับ Commercial ที่มีราคาคุ้มค่าที่สุด สำหรับงานที่ต้องการความหน่วงต่ำ (Low Latency) ซึ่งมีความเชี่ยวชาญในภาษาต่าง ๆ พร้อมกับการเขียนโปรแกรม เหมือนกับ Mixtral 8x7B แต่มีการวัดเกณฑ์ความเข้าใจภาษาในหลากหลายงาน (Massive Multitask Language Understanding หรือ MMLU) แล้วเหนือกว่าเล็กน้อย
- Mistral Large โมเดลระดับ Commercial เรือธงล่าสุดที่พร้อมสนับสนุนงานที่ซับซ้อนมากกว่า เนื่องจากมีขนาดที่ใหญ่กว่า Mistral Small จึงจะมีประสิทธิภาพดีกว่าทุก ๆ โมเดลที่ให้บริการจาก Mistral ณ ตอนนี้
สำหรับรายละเอียดของผลิตภัณฑ์อื่น ๆ สามารถอ่านได้ที่เว็บไซต์ Mistral AI
“Mistral Large” ผลิตภัณฑ์ชูธงสู้ GPT-4
จุดที่น่าสนใจอย่างยิ่งของ Mistral AI นั่นคือผลิตภัณฑ์ชูธงล่าสุดอย่าง “Mistral Large” ที่เพิ่งเปิดตัวไปเมื่อวันจันทร์ในสัปดาห์ที่ผ่านมานี้เอง ที่เรียกว่าประสิทธิภาพเหนือกว่าคู่แข่งจากยักษ์ใหญ่ไปพอสมควร
โดยจากการวัดผล MMLU กับโมเดลคู่แข่งเจ้าใหญ่ ทาง Mistral AI ได้แสดงให้เห็นว่าประสิทธิภาพของ Mistral Large นั้น “เหนือกว่า” ทั้ง Claude 2 ของ Anthropic และ Gemini Pro ของ Google รวมไปถึง Llama 2 ของ Meta เป็นที่เรียบร้อยแล้ว
โดยขีดความสามารถของ Mistral Large ที่หลากหลายและแข่งแกร่งไม่แพ้โมเดลจากยักษ์ใหญ่ทั้งเรื่องภาษาที่สามารถเข้าใจดีทั้งภาษาอังกฤษ ฝรั่งเศส อิตาเลียน เยอรมัน และสเปน พร้อมกับเรื่องการให้เหตุผลที่มีศักยภาพ การคำนวณคณิตศาสตร์ การเขียนโค้ด เรียกได้ว่า Mistral Large คืออีกโมเดลที่ต้องติดตามพัฒนาและมีโอกาสที่จะถูกนำไปพัฒนาต่อยอดในอุตสาหกรรมได้ไม่แพ้กับโมเดลอื่น ๆ ได้เลย
ความร่วมมือกับบริษัทยักษ์ใหญ่
ด้วยศักยภาพของ Mistral AI ต่าง ๆ เหล่านี้ จึงทำให้บริษัทยักษ์ใหญ่ในวงการหลายเจ้าเริ่มทยอยตบเท้าเข้ามาร่วมมือกับ Mistral AI มากขึ้นเรื่อย ๆ แล้ว โดยช่วยปลายปีที่แล้ว คือ Google Cloud ที่ได้จับมือเชิงกลยุทธ์กับ Mistral AI เป็นที่เรียบร้อย
และในเวลาเดียวกันกับที่ประกาศเปิดตัว Mistral Large นั้น ทาง Mistral AI ก็ได้ประกาศความร่วมมือเชิงกลยุทธ์กับ Microsoft ทั้งเรื่องให้ Mistral AI สามารถเข้าถึงโครงสร้างพื้นฐานของ Azure ได้ และพร้อมให้บริการ Mistral Large เป็นที่แรกบน Azure เป็นที่เรียบร้อยแล้ว ซึ่งทำให้ Mistral AI นั้นเป็นเจ้าที่ 2 ต่อจาก OpenAI ที่ Azure อนุญาตให้บริการในเชิงพาณิชย์บน Azure ได้แล้ววันนี้
ล่าสุด คือยักษ์ใหญ่สีฟ้าอย่าง IBM ที่ได้ประกาศความร่วมมือเปิดให้โมเดล Open Source อย่าง Mixtral 8x7B ของ Mistral AI นั้นมีบริการอยู่บน watsonx เป็นที่เรียบร้อย ซึ่งจะส่งผลให้องค์กรธุรกิจที่เป็นลูกค้า IBM สามารถเข้าถึงผลิตภัณฑ์ของ Mistral AI จากบริการของ watsonx ได้สะดวกยิ่งขึ้น และอาจส่งผลให้องค์กรหันมาใช้โมเดลจาก Mistral AI อันเป็นอีกทางเลือกจากค่ายอื่น ๆ ได้มากขึ้นในอนาคต
บทส่งท้าย
ทั้งหมดนี้ คือ Mistral AI สตาร์ตอัปที่เกิดขึ้นมาอายุไม่ครบ 1 ปีบริบูรณ์ดี ซึ่งเรียกได้ว่าน่าจับตาอย่างยิ่ง ด้วยขีดความสามารถของโมเดล LLMs อย่าง Mistral Large ที่เพิ่งเปิดตัวออกมา พร้อมกับความร่วมมือจากยักษ์ใหญ่ในอุตสาหกรรมไอทีที่เกิดขึ้นอย่างต่อเนื่อง จึงเป็นไปได้ที่ “Mistral AI” จะกลายเป็นดาวดวงใหม่แห่งวงการ AI ในอนาคตอันใกล้ และอาจจะเป็นคู่แข่งที่สูสีกับ OpenAI ได้ในเร็ววันนี้
- https://venturebeat.com/ai/mistral-ai-makes-waves-with-deals-across-tech-giants-including-microsoft-ibm/
- https://mistral.ai/
- https://mistral.ai/news/mistral-large/
- https://en.wikipedia.org/wiki/Mistral_AI
- https://azure.microsoft.com/en-us/blog/microsoft-and-mistral-ai-announce-new-partnership-to-accelerate-ai-innovation-and-introduce-mistral-large-first-on-azure/
- https://newsroom.ibm.com/2024-02-29-IBM-Announces-Availability-of-Open-Source-Mistral-AI-Model-on-watsonx,-Expands-Model-Choice-to-Help-Enterprises-Scale-AI-with-Trust-and-Flexibility