AWS ประกาศเปิดบริการ Textract บริการเครื่องมือสำเร็จรูปที่จะช่วยให้ผู้ใช้สามารถถอดตัวหนังสือและข้อมูล เช่น ตาราง ออกมาจากภาพเอกสารโดยไม่ต้องใช้ความรู้ด้านการเขียนโค้ดหรือ Machine Learning ให้ใช้งานกันได้แบบ General Availability แล้ววันนี้
Textract นั้นเป็นเครื่องมือ Optical Character Recognition ที่นอกจากจะช่วยให้ผู้ใช้สามารถวิเคราะห์และถอดตัวหนังสือออกมาจากภาพถ่ายหรือภาพสแกนเอกสารแล้ว ยังสามารถถอดข้อมูลอื่นๆออกมาตามบริบทอย่างแม่นยำ เช่น ตารางข้อมูลประกอบเอกสาร หรือข้อมูลที่ถูกกรอกลงในฟอร์มอย่างแบบฟอร์มภาษี โดยที่ผู้ใช้ไม่ต้องมีความรู้พื้นฐานด้าน Machine Learning, การเขียนโค้ด, หรือต้องมาคอยตรวจสอบบ่อยๆแต่อย่างใด
Textract รองรับการทำงานกับไฟล์หลากหลายประเภท ไม่ว่าจะเป็น ภาพสแกนเอกสาร ไฟล์ PDF และภาพถ่าย โดย Textract จะวิเคราะห์ไฟล์ที่ถูกจัดเก็บอยู่ใน Amazon S3 และบอกออกมาว่าไฟล์ดังกล่าวมีลักษณะอย่างไรผ่านวัตถุ JSON ซึ่งประกอบไปด้วยข้อมูลต่างๆ เช่น เลขหน้า หัวเรื่อง หัวข้อในแบบฟอร์ม และประเภทของข้อมูล ซึ่งผู้ใช้สามารถนำไปใช้ต่อได้โดยง่าย อีกทั้งยังสามารถเชื่อมต่อกับบริการอื่นๆของ AWS เช่น Amazon ElasticSearch เพื่อสร้างระบบค้นหาข้อมูลในเอกสาร, Amazon DynamoDB เพื่อจัดเก็บ, หรือจะนำไปใช้ต่อกับบริการด้าน Machine Learning อื่นๆ เช่น Amazon Translate, Amazon SageMaker ก็ได้
Amazon Textract จะเปิดให้บริการใน Region US East (Ohio), US East (N. Virginia), US West (Oregon), และ EU (Ireland) ก่อน และมีแผนที่จะเพิ่มไปยัง Region อื่นๆในอนาคต สำหรับท่านที่สนใจสามารถศึกษาข้อมูลเพิ่มเติมได้ที่ https://aws.amazon.com/textract