Snowflake ผู้ให้บริการ Data Cloud ชั้นนำ ล่าสุดได้ประกาศเตรียมซื้อกิจการ Ponder Data สตาร์ตอัปที่มุ่งหวังทำให้การเข้าถึงชุด Library ที่เป็นภาษา Python สำหรับ Data Science นั้นมีความง่ายขึ้น
โดยในวงการ Data Science ชุด Library ยอดนิยมในภาษา Python อย่าง Pandas หรือ Numpy นั้นคือส่วนสำคัญในการจัดเตรียมข้อมูล หรือการแปลง (Transform) เพื่อนำไปวิเคราะห์หรือสร้างเป็นโมเดล Machine Learning ต่อไป ซึ่งในส่วนนี้เอง มักจะไม่สามารถใช้งานได้กับชุดข้อมูลที่มีขนาดใหญ่มาก ๆ ส่งผลให้ต้องมีการเขียน Python workload ใหม่อยู่บ่อย ๆ บนเฟรมเวิร์ก Big Data ต่าง ๆ
ทั้งนี้ Snowflake ไม่ได้ให้ข้อมูลรายละเอียดใด ๆ เกี่ยวกับดีลดังกล่าว แต่บริษัทเผยว่าเตรียมที่จะขยายขีดความสามารถในการใช้ภาษา Python บนแพลตฟอร์มข้อมูลของบริษัท ที่จะให้ผู้ใช้งานระดับองค์กรและนักพัฒนาระบบมีแนวทางการทำงานที่ง่ายขึ้นกว่าเดิม
และนี่เองคือสิ่งที่ Ponder Data พยายามจัดการแก้ไขปัญหาในการทำให้ทีมข้อมูลที่ต้องจัดการข้อมูลขนาดใหญ่ด้วยภาษา python นั้นสามารถทำงานได้ง่ายขึ้น ด้วยการทำ Data Workflow ผ่านการรัน Python ได้โดยตรงบน Data Warehouse เลย ซึ่งจะทำให้สามารถทำกระบวนการ Workflow ซ้ำได้อย่างรวดเร็ว ตั้งแต่เริ่มทำ Prototype ไปจนถึง Deployment ที่สามารถรันได้อย่างปลอดภัยบนแพลตฟอร์มข้อมูลที่ใช้งาน
จนถึงวันนี้ Ponder สามารถสนับสนุนแพลตฟอร์มข้อมูลได้อย่างหลากหลาย ไม่ว่าจะเป็น Snowflake, Google BigQuery หรือแม้แต่ DuckDB ซึ่งด้วยดีลที่เกิดขึ้นนี้ คาดว่าผลิตภัณฑ์ของ Ponder จะเข้าไปอยู่ในส่วนหนึ่งของ Snowflake Data Cloud ที่จะช่วยให้ผู้ใช้งานสามารถรันไลบรารี Data Science ด้วยภาษา Python ได้ง่ายขึ้นกว่าเดิม และเชื่อว่าจะช่วยเร่งการพัฒนา ML และ Pipeline อื่น ๆ ได้เร็วขึ้นแน่นอน