OpenAI เปิดตัว ChatGPT โมเดล AI โต้ตอบแชทอย่างเป็นธรรมชาติ ช่วยแก้โค้ดได้ด้วย

0

OpenAI เปิดตัวโมเดล ChatGPT ซึ่งเป็น AI สำหรับการสนทนาที่สามารถโต้ตอบบทสนทนาได้อย่างมีประสิทธิภาพ สามารถถกเถียงข้อมูลที่ถูกต้อง และยอมรับความผิดพลาดของตัวเองได้ โดย ChatGPT นี้สามารถตอบคำถามได้อย่างหลากหลาย ช่วยในการเขียนเรียงความ หรือแม้กระทั่งช่วยแนะนำวิธีการเขียนและแก้โค้ดได้ด้วย

ChatGPT เป็นโมเดลสนทนาที่ถูกพัฒนาขึ้นด้วยเทคนิค Reinforcement Learning ให้สามารถพูดคุยกับมนุษย์ได้อย่างเป็นธรรมชาติ ต่อบทสนทนา ให้ข้อมูล โต้แย้งข้อเท็จจริงที่ไม่ถูกต้อง และยอมรับข้อผิดพลาดของตัวเอง นอกจากนี้ ตัวโมเดลยังมีกลไกป้องกันคำถามที่ไม่เหมาะสม

จากการทดลองใช้งาน โมเดล ChatGPT นี้สามารถตอบคำถามและต่อบทสนทนาได้อย่างมีประสิทธิภาพในหัวข้อต่างๆ และช่วยทำงานได้หลายเรื่อง เช่น การเขียนจดหมาย การเขียนเรียงความ หรือการรวบรวมข้อสรุปต่างๆ โดยในตัวอย่างจากทาง OpenAI สามารถใช้โมเดลนี้เพื่อช่วยเขียนและแก้โค้ดโปรแกรมมิ่งได้ด้วย

ทดลองใช้ ChatGPT ช่วยเขียน cover letter ในการสมัครงาน
ทดลองใช้ OpenGPT ตอบคำถามทั่วไป
ทดลองใช้ ChatGPT ตอบคำถามเกี่ยวกับภาษา

เบื้องหลังการทำงานของ ChatGPT คือการเทรนนิ่งผ่านเทคนิค Reinforcement Learning from Human Feedback (RLHF) ซึ่งใช้ความสามารถของมนุษย์มาช่วยในบางส่วนของการฝึกโมเดล โดย ChatGPT แบ่งการเทรนนิ่งออกเป็น 3 ขั้น ได้แก่

ขั้นตอนการเทรน ChatGPT (Photo: OpenAI)
  1. เตรียมข้อมูลวัตถุดิบขั้นต้น – ให้ Human AI Trainers ตอบคำถามที่สุ่มตั้งขึ้นมา จากนั้นนำข้อมูลในส่วนนี้ไปปรับปรุงความสามารถของโมเดล GPT-3.5 ซึ่งเป็นโมเดลประมวลผลภาษาธรรมชาติสารพัดประโยชน์จาก OpenAI ด้วยเทคนิค Supervised Learning
  2. ให้คะแนนกับคำตอบเพื่อสร้าง Reward Model – ใช้โมเดลในการตอบคำถามที่ถูกสุ่มขึ้นในหลายรูปแบบต่อคำถามหนึ่งข้อ จากนั้นส่งคำตอบเหล่านี้ไปให้มนุษย์เป็นผู้จัดลำดับเปรียบเทียบคำตอบจากชิ้นที่ดีที่สุดไปยังชิ้นที่แย่ที่สุด เมื่อได้ผลลำดับคะแนนสำหรับคำตอบหลายๆชุดแล้ว ก็นำข้อมูลเหล่านี้ไปพัฒนา Reward Model เพื่อใช้ในการประเมินคำตอบของ ChatGPT
  3. เทรนโมเดลเพื่อสร้างโมเดลที่ให้ผลลัพธ์ที่ดีที่สุด – นำโมเดลที่ได้จากในข้อ 1 มาใช้ตอบคำถามที่ถูกสุ่มขึ้น และใช้ Reward Model จากข้อที่ 2 ในการประเมินว่าผลลัพธ์นั้นเป็นอย่างไร และนำผลลัพธ์ในการประเมินนี้กลับไปพัฒนาโมเดลตอบคำถามข้างต้น เพื่อสร้างโมเดลที่ให้ Reward ได้ดีกว่าเดิม

OpenAI ทำการเทรนนิ่งโมเดลนี้ผ่านบริการซุปเปอร์คอมพิวเตอร์ของ Azure AI ผลลัพธ์ที่ได้คือ ChatGPT ที่เพิ่งเปิดตัวออกมา และสามารถสมัครเข้าไปทดลองใช้ได้ที่เว็บไซต์ของ OpenAI

อย่างไรก็ตาม แม้โมเดลนี้จะสามารถตอบโต้ เขียน และผลิตคอนเทนท์ได้อย่างมีประสิทธิภาพและน่าสนใจ ChatGPT ก็ยังมีข้อจำกัดอยู่หลายด้าน เช่น การให้คำตอบที่ฟังดูน่าเชื่อถือแต่ไม่เป็นความจริง ความอ่อนไหวต่อรูปประโยคของคำถามที่ต่างกัน ทำให้สามารถตอบคำถามที่ถามถึงใจความเดียวกันไม่ได้ทั้งหมด การให้คำตอบที่ยืดเยื้อใช้คำอย่างฟุ่มเฟือย การคาดเดาจุดมุ่งหมายของผู้ถามไปเอง และการที่โมเดลยังไม่สามารถกำจัดคำตอบที่มีอคติและคำตอบที่เป็นอันตรายได้ทั้งหมด โดย OpenAI ได้อธิบายถึงข้อจำกัดเหล่านี้ไว้ในบล็อค

ผู้ที่สนใจสามารถทดลองใช้งาน ChatGPT ได้ที่ https://chat.openai.com/


ที่มา: https://openai.com/blog/chatgpt/