บริษัทเทคโนโลยีรายใหญ่ต่างตบเท้าเข้าร่วมในชุมชนนักพัฒนาโมเดล Generative AI อย่างแข่งขัน และ Apple ก็ไม่น้อยหน้า โดยได้เผยแพร่ OpenELM โมเดล LLM 8 ตัวแบบโอเพ่นซอร์สผ่าน Hugging Face ให้นำไปใช้งานกันต่อได้ฟรี
OpenELM นั้นเป็นโมเดล LLM สำหรับสร้างข้อความ (Text-generating) ภายในโปรเจกต์ประกอบไปด้วยโมเดล LLM 8 ตัว แบ่งออกเป็น Pre-trained 4 ตัวและปรับแต่งแล้ว 4 ตัว โดยโมเดลขนาดที่ใหญ่ที่สุดนั้นผ่านการเทรนจากข้อมูลกว่า 3,000 ล้านพารามิเตอร์ ซึ่ง OpenELM นั้นเป็นโมเดลที่สามารถทำงานได้บนอุปกรณ์ที่ติดตั้งและไม่ต้องเชื่อมต่อกับระบบอื่นๆบนคลาวด์
โมเดลแบบ Pre-trained นั้นพูดอย่างง่ายๆก็คือโมเดลที่เกือบๆจะใช้งานได้ กล่าวคือเป็นโมเดลที่มีความสามารถในการสร้างหรือทำนายข้อความจากข้อความที่ระบุไป แต่การที่โมเดล LLM จะใช้งานได้จริงจะต้องผ่านการปรับแต่งหรือ Instruction-tuned ซึ่งจะช่วยเสริมความสามารถของโมเดลในด้านต่างๆให้ทำงานได้ตามวัตถุประสงค์ เช่น การเพิ่มคลังคำศัพท์ การปรับแต่งเพื่อสร้างผลลัพธ์ในสไตล์ที่ต้องการ เช่นในโมเดล LLama จาก Meta ก็มีโมเดลย่อยที่สามารถทำงานได้ดีกับงานโค้ดดิ้งหรือบทสนทนาทั่วไป
ในการใช้งาน หากนำ OpenELM ไปใช้โดยตรงโดยไม่มีการปรับแต่งใดๆ Apple ระบุว่าผู้ใช้จะต้องใส่ประกาศ License ที่ติดมากับโมเดลนี้ไปด้วย โดย Apple เผยแพร่โมเดลดังกล่าวโดยไม่การันตีถึงความปลอดภัยและโมเดลดังกล่าวอาจให้ผลลัพธ์ที่มีความสุ่มเสี่ยง อคติ หรือผิดพลาดได้
นับเป็นเรื่องแปลกตาเลยทีเดียวสำหรับบริษัทอยาก Apple ที่ไม่ค่อยเปิดเผยซอฟต์แวร์ของตัวเองเท่าไหร่นักนำ OpenELM มาเปิดเป็นโอเพ่นซอร์สเช่นนี้ สามารถศึกษารายละเอียดรวมถึงสถิติต่างๆของ OpenELM ได้ที่ OpenELM Instruct Model
ที่มา: Apple releases OpenELM: small, open source AI models designed to run on-device