ในช่วงไม่กี่ปีที่ผ่านมา Google ได้เปิดตัวผลิตภัณฑ์ที่ช่วยให้การพัฒนาระบบที่ใช้เทคโนโลยี machine learning เป็นไปโดยสะดวกรวดเร็วและง่ายดายออกมาหลายตัว สำหรับผู้ที่มีความเชี่ยวชาญด้านปัญญาประดิษฐ์ กูเกิลมีเครื่องมืออย่าง TensorFlow ที่เข้ามาอำนวยความสะดวกให้กับนักพัฒนาในการเขียนโปรแกรมเพื่อสร้างโมเดล machine learning หรือสำหรับผู้ที่ไม่สันทัดในการพัฒนาโมเดล กูเกิลก็มีบริการ machine learning สำเร็จรูป เช่น Cloud Vision API ที่นักพัฒนาและธุรกิจสามารถนำไปใช้งานได้ทันที ทว่าหากคุณไม่มีความเชี่ยวชาญในด้าน machine learning มากพอที่จะพัฒนามันขึ้นมาเองตั้งแต่ต้น แต่มีความต้องการใช้งาน machine learning ในรูปแบบที่แตกต่างออกไปจากบริการสำเร็จรูปที่กูเกิลมีอยู่? AutoML บริการใหม่นี้อาจเป็นคำตอบของคุณ
บริการ Cloud AutoML นี้เป็นบริการใหม่ที่กูเกิลเปิดตัวไปเมื่อช่วงต้นปี 2018 นี้เอง โดยหัวใจของมันคือการช่วยธุรกิจที่มีข้อจำกัดด้านความเชี่ยวชาญใน machine learning ให้สามารถสร้างโมเดลคุณภาพสูงที่ปรับแต่งตามความต้องการของธุรกิจได้ ปัจจุบันบริการในกลุ่ม AutoML นี้มีด้วยกัน 3 ตัว คือ Cloud AutoML Vision, Cloud AutoML Natural Language, และ Cloud AutoML Translation ซึ่ง 2 บริการหลังนี้เพิ่งมีการเปิดตัวออกมาสดๆร้อนๆที่งาน Google Next 18 ที่ผ่านมา
การพูดถึงความสามารถของบริการเหล่านี้อาจไม่ช่วยให้เห็นภาพนัก ในที่นี้จึงจะขอยกตัวอย่างการใช้งานของ AutoML Vision จากเอกสารของกูเกิลให้ผู้อ่านได้เข้าใจการนำบริการดังกล่าวไปใช้งานมากขึ้น
แต่ก่อนจะพูดถึงการใช้งานในกรณีนี้ ก็ต้องขอเกริ่นสั้นๆเสียก่อนว่า Cloud Vision API และ AutoML Vision ต่างกันอย่างไร
Cloud Vision API นั้นเป็นบริการ machine learning สำเร็จรูปที่สามารถวิเคราะห์ภาพถ่ายได้อย่างแม่นยำที่ธุรกิจสามารถนำไปใช้งานได้ทันที บริการนี้ช่วยให้ธุรกิจไม่ต้องกังวลถึงขั้นตอนการพัฒนา ติดตั้ง คุณภาพของโมเดล เพราะกูเกิลจะเป็นผู้จัดการพัฒนาและปรับปรุงประสิทธิภาพอยู่เบื้องหลังทั้งหมด เป็นต้นว่าหากผู้ใช้ลองนำภาพถ่ายในบ้านไปวิเคราะห์ในระบบ บริการ Cloud Vision ก็จะสามารถตอบได้อย่างแม่นยำว่าในรูปนั้นประกอบไปด้วย โต๊ะ โคมไฟ เก้าอี้ และโซฟา อย่างแม่นยำ
ทว่าสำหรับธุรกิจแล้ว การผลการวิเคราะห์เช่นนั้นอาจยังไม่เพียงพอต่อการใช้งาน ลองจินตนาการถึงธุรกิจการผลิตที่มีการผลิตชิ้นส่วนที่หลากหลายและเฉพาะกลุ่ม ไม่ว่า Cloud Vision จะเก่งแค่ไหน คงไม่สามารถจำแนกชิ้นส่วนได้ถูกต้องตามประเภทที่ธุรกิจต้องการ เมื่อใช้งาน machine learning สำเร็จรูปไม่ได้ ทางเลือกที่เหลืออยู่ก็คือการพัฒนาโมเดลที่ตรงตามความต้องการที่มีความแม่นยำสูงขึ้นมาใช้งานเอง แต่ในการทำเช่นนั้นย่อมต้องอาศัยความเชี่ยวชาญในด้าน machine learning ซึ่งเป็นปัจจัยที่หลายๆธุรกิจยังขาดอยู่
AutoML Vision นั้นเป็นระบบที่ถูกออกแบบขึ้นเพื่ออุดรอยรั่วดังกล่าว ช่วยให้ธุรกิจสามารถพัฒนาโมเดลตามความต้องการได้โดยไม่ต้องเขียนโค้ด และที่มากไปกว่านั้นคือโมเดลนี้จะทำงานอยู่บนเทคโนโลยีการประมวลผลภาพถ่ายที่แม่นยำของกูเกิล ทำให้ผลลัพธ์ที่ออกมาคือโมเดลที่มีความแม่นยำและตอบโจทย์ธุรกิจอย่างแท้จริง
AutoML Vision กับการสร้างโมเดลเพื่อจัดกลุ่มสถาปัตยกรรมของอาคารภายในเมือง
ปัญญาประดิษฐ์ของ Cloud Vision นั้นสามารถจำแนกภาพถ่ายสิ่งปลูกสร้างออกจากวัตถุอื่นๆ เช่น รถยนต์ ถนน หรือต้นไม้ ได้อย่างแม่นยำ แต่หากคุณเป็นเจ้าของบริษัทอสังหาริมทรัพย์ การระบุสิ่งปลูกสร้างออกจากต้นไม้นั้นอาจไม่มีประโยชน์ต่อธุรกิจมากนัก สิ่งที่คุณต้องการอาจเป็นโมเดล machine learning ที่สามารถระบุสถาปัตยกรรมรูปแบบต่างๆของสิ่งปลูกสร้างรอบเมือง และ AutoML Vision ช่วยให้คุณพัฒนาโมเดลนั้นได้แม้คุณไม่มีความเชี่ยวชาญด้านปัญญาประดิษฐ์เป็นพิเศษ
AutoML Vision ถูกออกแบบมาให้เรียนรู้จากชุดข้อมูลที่ผู้ใช้ป้อนเข้าไป หากผู้ใช้ต้องการสร้างโมเดลที่สามารถจัดกลุ่มสถาปัตยกรรม สิ่งที่พวกเขาต้องทำก็คือการป้อนข้อมูลภาพถ่ายและป้ายชื่อที่ระบุประเภทของสถาปัตยกรรมของสิ่งปลูกสร้างในรูปถ่ายนั้นๆ (หรือใช้บริการ human labelling ที่ใช้พนักงานมนุษย์ระบุประเภท (label) ของสิ่งของเพื่อสร้างชุดข้อมูลที่มีคุณภาพ) ระบบเบื้องหลังของ AutoML Vision ก็จะทำการพัฒนาโมเดล machine learning แบบ supervised learning ที่สามารถจำแนกกลุ่มของสิ่งปลูกสร้างได้ โดยผู้ใช้สามารถปรับแต่งเงื่อนไขและตรวจสอบความแม่นยำของโมเดลนั้นได้ในหน้า console ทันที
ให้ AI ทำหน้าที่ Machine Learning Expert แทนคุณ
เบื้องหลังของระบบ AutoML ที่สามารถสร้างโมเดลขึ้นจากชุดข้อมูลของผู้ใช้ได้เองนี้ คือเทคโนโลยี reinforcement learning ที่ประกอบไปด้วย neural network ตัวควบคุม (controller) ที่สามารถเสนอไอเดียกลไกการทำงานของโมเดล และระบบที่คอยทดสอบและให้ feedback ว่าตัวควบคุมควรปรับปรุงโมเดลที่เสนอมานี้อย่างไรบ้าง หลังการเสนอไอเดีย ทดสอบ และปรับปรุงรอบแล้วรอบเล่า ท้ายที่สุดแล้ว ตัวควบคุมก็จะเรียนรู้ที่จะเสนอโมเดลที่สามารถทำงานได้อย่างดีเยี่ยมทัดเทียมโมเดลที่ดีที่สุด (state-of-the-art) ในปัจจุบัน ซึ่งเมื่อนำมาใช้งานจริง โมเดลที่ตัวควบคุมเสนอมานี้ ก็คือโมเดลผลลัพธ์ของบริการ AutoML นั่นเอง
การสร้างโมเดลด้วย reinforcement learning เบื้องหลังนี้ช่วยการันตีให้กับผู้ใช้ในระดับหนึ่งว่าโมเดลที่ได้จาก AutoML นั้นจะเป็นโมเดลที่คุณภาพสูง มีความแม่นยำ ใช้งานในธุรกิจได้จริง แต่ทั้งนี้ทั้งนั้นชุดข้อมูลที่ผู้ใช้ป้อนเข้าไปเป็นตัวตั้งต้นก็มีผลกับความแม่นยำของโมเดลเช่นกัน ซึ่งกูเกิลก็ได้มีการแนะนำการเตรียมการชุดข้อมูลและการปรับแต่งระบบเพื่อให้โมเดลมีประสิทธิภาพสูงสุดไว้ในเอกสารของ AutoML และสำหรับ AutoML Vision นั้น Google ก็ได้พัฒนาเทคนิคที่ช่วยให้โมเดลทำงานได้อย่างแม่นยำแม้ชุดข้อมูลตั้งต้นจะมีปริมาณไม่มาก
โมเดลที่ถูกสร้างโดย AutoML นั้นสามารถนำไปใช้งานได้ทันทีผ่าน REST หรือ RPC API โดยธุรกิจไม่ต้องกังวลถึงการติดตั้งเซิฟเวอร์ และสามารถจัดการกับโมเดลทั้งหมดได้ผ่านหน้า console ของ Google โดยตรง ซึ่งช่วยลดกำแพงทั้งในด้านความรู้ machine learning และลดภาระหน้าที่ในการดูแล ติดตั้ง และอัพเดทระบบได้เป็นอย่างดี
นอกจาก AutoML Vision แล้ว Google ยังมี Cloud AutoML Natural Language และ Cloud AutoML Translation ที่ใช้หลักการเดียวกันนี้สร้างโมเดลเพื่อการจำแนกประเภทของข้อเขียนและสร้างโมเดลแปลภาษาสำหรับข้อเขียนที่มีความเฉพาะเจาะจง (เช่น เป็นการแปลภาษาสำหรับข่าวด้านการเงินโดยเฉพาะ เป็นต้น) ตามลำดับ
ปัจจุบัน บริการในกลุ่ม AutoML ทั้ง 3 ตัวนั้นยังคงอยู่ในช่วง beta โดยมีธุรกิจหลายราย เช่น Disney, ZSL, Nikkei, และ Urban Outfitters เริ่มนำไปใช้งานเพิ่มประสิทธิภาพให้กับการดำเนินธุรกิจแล้ว หากผู้อ่านท่านใดสนใจระบบพัฒนา AI ด้วย AI ตัวนี้ สามารถศึกษารายละเอียดเพิ่มเติมได้ที่หน้าเว็บไซต์ของ Google Cloud AutoML