จับตาเทรนด์ Generative AI ยกระดับธุรกิจด้วย Chochae GPT แชตบอต AI สัญชาติไทย

0

จบไปเป็นที่เรียบร้อยสำหรับ ADPT Webinar: จับตาเทรนด์ Generative AI | ยกระดับธุรกิจด้วย Chochae GPT แชตบอต AI สัญชาติไทยที่ทาง ADPT จัดขึ้นเมื่อวันที่ 15 ก.พ.2024 ที่ผ่านมา บรรยายโดย “ดร.กอบกฤตย์ วิริยะยุทธกร” ผู้ก่อตั้งและ CEO บริษัท iApp Technology และนายกสมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย (AIEAT) 

เรียกได้ว่าเป็นอีก ADPT Webinar ที่มีเนื้อหาเข้มข้น และมีความรู้มากมายในเซสชันนี้ ทางทีมงานจึงนำเอาเนื้อหาบางส่วนภายในเซสชันที่ ดร.กอบกฤตย์ ได้บรรยายไว้ ทั้งเรื่อง OpenThaiGPT หรือ Chochae GPT มาสรุปให้ในบทความนี้

ความหมายของคำว่า Generative AI แท้จริงแล้วเป็นเพียงแค่หลักการที่อธิบายถึงชนิดของเทคโนโลยี AI ที่สามารถ “สร้างสรรค์” เนื้อหาหรือข้อมูลขึ้นมาใหม่ได้ ซึ่งเนื้อหาหรือข้อมูลนั้นสามารถเป็นได้หลากหลายรูปแบบ ไม่ว่าจะเป็นข้อความ ภาพ เสียง หรือว่าวีดีโอ ทั้งหมดเรียกว่า Generative AI ทั้งสิ้น เช่น โมเดลสังเคราะห์ภาพอย่าง Midjourney หรือ DALL-E

หากแต่เมื่อพูดถึง Generative AI ส่วนใหญ่มักจะนึกถึง “ChatGPT” เป็นลำดับต้น ๆ สาเหตุเป็นเพราะ ChatGPT นี้ถือว่าเป็นตัว “พลิกโลก” ที่ส่งแรงกระเพื่อมไปในวงกว้างมาก ๆ จนทำให้องค์กรชั้นนำของโลกล้วนต้องปรับเปลี่ยนผลิตภัณฑ์นำโมเดล GPT มาใส่เพื่อเสริมศักยภาพกันทั้งสิ้น ด้วยขีดความสามารถในการสร้าง Text ออกมาได้อย่างหลากหลาย Use Case เช่น พูดคุยได้เหมือนแชตบอตที่เป็นธรรมชาติ แต่งเพลงได้ อ่านหนังสือได้

ด้วยความนิยมที่เกิดขึ้นอย่างก้าวกระโดดของ ChatGPT จึงส่งผลให้เกิดโมเดล Generative AI ตัวใหม่ ๆ ที่ทำงานคล้าย ๆ กันออกมาอย่างมหาศาล ไม่ว่าจะเป็น Bard (ปัจจุบันคือ Gemini), Claude, BloombergGPT, Einstein GPT เป็นต้น 

สิ่งที่อยู่เบื้องหลังของ Generative AI ชนิดนี้ นั่นคือ “โมเดลภาษาขนาดใหญ่ หรือ Large Language Model (LLM)” โดยปัจจุบัน ยักษ์ใหญ่ไอทีก็เริ่มมีเปิด Open Source ออกมาเพื่อนำไปใช้ต่อยอดกันได้แล้ว อาทิ Llama 2 ของ Meta, Mistral AI หรือล่าสุดอย่าง Gemma จากทาง Google DeepMind ดังนั้น ปฏิเสธไม่ได้เลยว่า LLM คือเทรนด์ของ Generative AI ในยุคนี้อย่างแน่นอน

ทนอย” ผู้ช่วยทนาย AI Chatbot ที่มี LLM เป็นเทคโนโลยีอยู่เบื้องหลัง

แม้ว่าจะมีโมเดล LLM อันทรงพลังเปิด Open Source ให้ใช้งานได้ฟรีอยู่แล้วก็ตาม แต่ภาษาไทยเมื่อเทียบกับภาษาอื่น ๆ ทั่วโลกก็ยังถือว่าไม่ได้เป็นที่นิยมในลำดับต้น ๆ (อ้างอิงตามจำนวนประชากร) จึงทำให้ภาษาไทยไม่ได้ถูกพัฒนาต่อยอดในโมเดล LLM มากนัก

ด้วยเหตุนี้เอง สมาคม AIEAT ร่วมกับ AIAT และ NIA จึงได้ร่วมกันสร้างและเปิดตัว “OpenThaiGPT” ในช่วงสิงหาคม 2023 ที่ผ่านมา โดยเป็นการนำเอาโมเดล Llama 2 มาต่อยอดให้สามารถใช้ภาษาไทยได้อย่างคล่องแคล่วขึ้น เพื่อทำให้ประเทศไทยมีโมเดล LLM ของไทยที่มีความฉลาดในภาษาไทย ใช้งานในประเทศไทยได้อย่างเต็มประสิทธิภาพและใช้งานในเชิงพาณิชย์ได้

โดย OpenThaiGPT นั้นถือได้ว่าเป็นโมเดล LLM สัญชาติไทยที่ทั้ง “ฟรี” และ “Open Source” ที่สามารถสร้างข้อความภาษาไทยได้อย่างมีประสิทธิภาพ 

ดร.กอบกฤตย์ ได้กล่าวในเซสชัน ADPT Webinar ว่า OpenThaiGPT นั้นสามารถสร้างข้อความไทยออกมาได้เร็วกว่า ChatGPT-4 ถึง “10 เท่า” ซึ่งปัจจุบัน OpenThaiGPT มีความฉลาดเทียบเท่ากับ ม.6 โดยจากการทดสอบด้วยข้อสอบ O-Net เมื่อปี 2021 ที่ผ่านมาแบบไม่เคยเห็นมาก่อน (Unseen) พบว่า OpenThaiGPT ณ ตอนนั้นได้คะแนนมากกว่าคะแนนเฉลี่ยของเด็กไทยถึง “เกือบ 2 เท่า” เลยทีเดียว

เช่นเดียวกับโมเดล AI ทั่วไปที่จะต้องมี 2 สิ่งที่จะทำให้ AI มีประสิทธิภาพ นั่นคือ “หน่วยประมวลผลอันทรงพลัง” กับ “ข้อมูลที่ดีและมีปริมาณมากพอ” ซึ่งสิ่งที่ทำให้ OpenThaiGPT เกิดขึ้นมาได้สำเร็จนั้น มาจาก 2 สิ่งสำคัญ ได้แก่

  • Lanta HPC เครื่อง Supercomputer ที่ตั้งอยู่ใน สวทช. ประเทศไทย ซึ่งถือว่าเป็นเครื่อง Supercomputer เร็วที่สุดในระดับอาเซียนเลยทีเดียว โดยภายในมีการ์ด NVIDIA A100 จำนวนถึง 700 ใบ ซึ่งเหมาะอย่างยิ่งกับงานที่ต้องใช้การประมวลผลจำนวนมหาศาล
  • Pantip.com ข้อมูลคุณภาพสูงที่ทาง Pantip ได้รับการบริจาคข้อมูลการสนทนาทุกกระทู้มาตั้งแต่เริ่มต้นเว็บไซต์ราว 20 ปีที่แล้ว ด้วยข้อมูลของ Pantip.com ที่ถือว่ามีคุณภาพสูง เนื่องจากเป็นข้อมูลที่คนไทยพิมพ์เข้าไปจริง ๆ จึงสามารถนำมาใช้ฝึกฝนได้อย่างมีประสิทธิภาพ

ตั้งแต่ OpenThaiGPT ได้เปิดตัวและเปิดให้ดาวน์โหลดได้ตั้งแต่เดือนสิงหาคม 2023 ที่ผ่านมา ปัจจุบันมีการดาวน์โหลดไปแล้ว “มากกว่า 3 หมื่นครั้ง” รวมทั้งมีการนำไปต่อยอดพัฒนาอีกกว่า 80 โมเดลที่ Open Source ต่อเป็นที่เรียบร้อยด้วย โดยเมื่อปลายปี ทาง AIEAT ได้ปล่อย OpenThaiGPT เวอร์ชัน 13b พารามิเตอร์ไปเป็นที่เรียบร้อย 

โดยใน ADPT Webinar ดร.กอบกฤตย์ ได้แสดงเวอร์ชันเดโมที่สร้างขึ้นมาเมื่อปีที่แล้วนั้น สามารถใช้เวลาสร้างเนื้อหาบทความภาษาไทยจำนวน 1 ย่อหน้า (ดูความยาวตามภาพ) ใช้เวลาราว 12 วินาที ซึ่งก็เร็วกว่า ChatGPT 4 เรียบร้อยแล้ว 

และ “ภายในสิ้นเดือน ก.พ. 2024 นี้ ทาง AIEAT จะปล่อย OpenThaiGPT เวอร์ชันตัวเต็มขนาด 70b พารามิเตอร์” ออกมาให้ใช้งานกันได้ ซึ่งประสิทธิภาพและขีดความสามารถจะสูงขึ้นอย่างมหาศาล รวมทั้งความเร็วที่จะสามารถสร้าง 1 ย่อหน้าได้เร็วภายใน 6 วินาทีเท่านั้น

ผู้ที่สนใจอยากศึกษาข้อมูลเพิ่มเติมเกี่ยวกับ OpenThaiGPT สามารถเข้าไปที่เว็บไซต์ OpenThaiGPT รวมทั้งสามารถเข้าร่วมกลุ่ม Facebook Group ได้เลย 

หรือหากเป็นนักพัฒนาระบบ สามารถดาวน์โหลดและใช้งานในเครื่องตัวเองได้แล้ววันนี้ ผ่านทาง GitHub หรือ Hugging Face โดยโมเดลต่าง ๆ เหล่านั้นสามารถดาวน์โหลดได้ฟรีและใช้งานในเชิงพาณิชย์ได้ด้วย

นอกจากนี้ ทาง AIEAT กำลังเขียนงานตีพิมพ์เกี่ยวกับ OpenThaiGPT เพื่อนำเสนอในงาน “ACL 2024” ที่จะจัดในประเทศไทยในเดือนสิงหาคม 2024 ที่กรุงเทพมหานครนี้ด้วย หากใครที่อยู่ในสายงาน AI/ML หรือว่าเป็นนักวิจัยพัฒนาในด้าน AI หรือ Generative AI พลาดไม่ได้ด้วยประการทั้งปวง

จาก ADPT Webinar ที่ทาง ดร.กอบกฤตย์ ได้มาบอกเล่าถึงขั้นตอนโดยทั่วไปในการฝึกฝนโมเดล LLM ให้มีความฉลาดเพียงพอที่จะใช้งานได้ จะประกอบไปด้วย 3 ขั้นตอนที่สำคัญ ได้แก่

1. Pretraining

ขั้นตอนการฝึกฝนที่ถือได้ว่ามีราคาแพงที่สุดและใช้เวลามากที่สุด โดยจะเป็นการเรียนรู้ตั้งแต่เริ่มต้นเหมือนเด็กแรกเกิด เช่น มนุษย์ใช้ภาษาอย่างไร อะไรคือคำ เป็นต้น ซึ่งตรงนี้ OpenThaiGPT ฝึกฝนโมเดลในเรื่องภาษาไทยไว้ให้เรียบร้อยแล้ว

2. Fine-Tuning 

ขั้นตอนการทำให้โมเดล LLM เรียนรู้ทักษะใหม่ที่ต้องการ เช่น ระบบ AI สำหรับดูดวง ที่จำเป็นต้องใช้ข้อมูลในเรื่องนั้น ๆ เช่น วันเดือนปีเกิดและคำอธิบายดวง มาฝึกฝน เพื่อให้โมเดลเรียนรู้ และสามารถดูดวงอัตโนมัติได้ ซึ่งจำเป็นต้องมีข้อมูลจำนวนมาก ๆ อย่างน้อย 1000 ข้อมูล เป็นต้น

3. RAG ข้อมูล 

ขั้นตอนเชิงเทคนิคที่ง่ายที่สุดในการปรับให้โมเดลมีความฉลาดมากขึ้น ซึ่งเป็นเหมือนการทำ Prompt Engineering โดยอาจมองเหมือนการมีเครื่องมือระบบสืบค้น (Search Engine) ภายในโมเดลที่สามารถใส่องค์ความรู้เข้าไปเพื่อทำให้เป็นคลังห้องสมุด ที่มีบรรณารักษ์ช่วยค้นหาสิ่งที่เกี่ยวข้องมาให้เพิ่มเติมก่อนที่จะส่งให้กับโมเดล LLM อีกที เป็นต้น

อย่างไรก็ดี โมเดลต่างประเทศโดยทั่วไปจะอนุญาตให้ปรับแต่งดำเนินการได้เฉพาะขั้นตอนที่ 3 เท่านั้น หากแต่ OpenThaiGPT จะเปิดให้สามารถทำได้ทั้ง 3 ขั้นตอนได้เลย ด้วยเหตุนี้เอง จึงถือได้ว่า OpenThaiGPT คือโมเดล LLM สัญชาติไทย ที่คนไทย สามารถนำไปใช้งานได้อย่างเต็มที่ ไม่มีขีดจำกัดใด ๆ ทั้งสิ้น

หากองค์กรธุรกิจต้องการเร่งความเร็วในการปรับใช้ Generative AI อย่าง LLM ในการให้บริการลูกค้าให้ได้รับประสบการณ์ใหม่ผ่านแชตบอต AI อันทรงพลังที่สามารถเข้าใจคลังความรู้ข้อมูลขององค์กรได้อย่างมีประสิทธิภาพ เพื่อให้บริการลูกค้าได้ตลอด 24 ชั่วโมง ทาง iApp Technology มีบริการ “Chochae GPT” ที่ช่วยสนับสนุนต่อยอด OpenThaiGPT ให้กลายเป็นแชตบอต AI ที่องค์กรพร้อมใช้งานได้อย่างรวดเร็ว

Chochae GPT นั้นเป็นเสมือนหน้าจอ (User Interface หรือ UI) ที่มีโมเดล OpenThaiGPT อันทรงประสิทธิภาพอยู่เบื้องหลัง ทำให้องค์กรสามารถใช้งานได้สะดวกมากยิ่งขึ้นในการนำ OpenThaiGPT มาเรียนรู้ข้อมูลต่าง ๆ ที่มีภายในองค์กรได้ผ่านเว็บไซต์ และสามารถนำเอา Chochae GPT ที่ปรับแต่งมาสำหรับองค์กรโดยเฉพาะ ไปเชื่อมโยงกับ API ต่าง ๆ ขององค์กร เช่น เว็บไซต์, LINE, Facebook เพื่อให้แชตบอตช่วยสนับสนุนบริการให้กับลูกค้าองค์กรได้ทันที

ตัวอย่างเช่น องค์กรต้องการสร้างแชตบอต AI ที่สนทนากับลูกค้าด้วยภาษาไทยอย่างเป็นธรรมชาติ เพื่อสนับสนุนการขายสินค้าผ่าน LINE เพียงแค่เข้าเว็บไซต์ Chochae GPT แล้วนำข้อมูลอันเป็นองค์ความรู้ต่าง ๆ ขององค์กรที่เกี่ยวกับการขายสินค้าใส่เข้าไปให้ Chochae GPT เรียนรู้ ภายในเวลาไม่นานนัก แชตบอต AI ก็พร้อมให้บริการได้ทันที หากใครสนใจสามารถดูตัวอย่างสาธิตการใช้งาน Chochae GPT ได้ใน ADPT Webinar 

นอกจากนี้ ดร.กอบกฤตย์ เผยด้วยว่า Chochae GPT ในเวอร์ชันล่าสุดนั้นมีความเร็วเยอะขึ้นมากกว่าที่สาธิตอีกด้วย รวมทั้งในอนาคต Chochae GPT จะมีการเชื่อมโยงกับระบบ AI อื่น ๆ กว่า 20 บริการของ iApp อย่างเช่น ระบบ OCR เพื่ออ่านข้อมูลบนภาพแล้วเปลี่ยนให้เป็นข้อความเอานำเข้าไปให้ Chochae GPT เรียนรู้ได้ด้วย 

หากสนใจผลิตภัณฑ์ของ iApp สามารถอ่านบทความสัมภาษณ์ของ iApp Technology กับทาง ADPT ก่อนหน้านี้ได้ที่นี่ หรือดูบนเว็บไซต์ iApp เพิ่มเติมเพื่อดูบริการทั้งหมดได้

แน่นอนแล้วว่า Generative AI กำลังเป็นเทรนด์ที่ร้อนแรงในปัจจุบัน และกำลังจะมีบทบาทสำคัญอย่างมากในการทำธุรกิจในอนาคต ถ้าหากไม่เริ่มปรับเปลี่ยนหรือปรับใช้ Generative AI ตั้งแต่วันนี้ ไม่แน่ว่าองค์กรอาจจะถูก Disrupt โดยผู้ที่ใช้งาน Generative AI อย่างคล่องแคล่วในอนาคต ก็เป็นได้

หากองค์กรธุรกิจใดมีความสนใจในผลิตภัณฑ์ใด ๆ ไม่ว่าจะเป็น AI สนับสนุนต่าง ๆ หรือ Generative AI อย่าง Chochae GPT, ทนอย หรือแม้แต่ OpenThaiGPT สามารถติดต่อทาง iApp Technology ได้ในทุกช่องทาง

สำหรับท่านใดที่ต้องการรับฟัง ADPT Webinar: จับตาเทรนด์ Generative AI | ยกระดับธุรกิจด้วย Chochae GPT แชตบอต AI สัญชาติไทยย้อนหลังเต็ม ๆ สามารถดูวิดีโอย้อนหลังได้ด้านล่างนี้