แม้จะมีการรณรงค์เปลี่ยนมาใช้เอกสารดิจิทัล แต่หลาย ๆ องค์กรในทุกอุตสาหกรรมคงหนีไม่พ้นกับเอกสารกระดาษ ไม่ว่าจะเป็นใบสั่งซื้อ ใบแจ้งยอด หลักฐานบันทึกต่าง ๆ ซึ่งอาจเรียกได้ว่าเป็น Pain point หนึ่งของการทำงานเลยก็ว่าได้ ไหนจะสิ้นเปลืองค่ากระดาษ ค่าหมึกพิมพ์ ยังไม่รวมถึงเวลาที่เสียไปกับการค้นหาเอกสารอีก ซึ่งจริง ๆ แล้วทั้งเงินและเวลาเหล่านั้นสามารถเอาไปใช้ลงทุนทำงานอย่างอื่นให้มีประสิทธิภาพมากกว่านี้ได้
จะดีกว่าหรือไม่หากมีโซลูชันที่ช่วยจัดการและจัดระเบียบเอกสารได้ง่าย ๆ อีกทั้งช่วยลดขั้นตอนการทำงานและประหยัดต้นทุนได้ยิ่งขึ้น บทความนี้จึงขอพาทุกท่านไปรู้จักกับ ระบบการประมวลผลเอกสารอัจฉริยะ (Intelligent document processing หรือ IDP) ที่จะช่วยปลดล็อกข้อจำกัดของการทำงานเอกสารได้
Pain Point ของงานเอกสาร
The Paperless Project ชี้ว่า บริษัทส่วนใหญ่หมดงบไปถึง 15% ของรายได้ไปกับเอกสารกระดาษ คิดเป็นมูลค่าราว 3.85 พันล้านบาท ซึ่งนับว่าเป็นเงินจำนวนไม่น้อยที่ลงไปกับกระดาษที่มีอายุการใช้งานเพียงระยะเวลาสั้น ๆ
นอกจากจะสิ้นเปลืองเงินแล้วยังเสียเวลาและเสี่ยงต่อการผิดพลาดด้วย โดยผลสำรวจจาก ABBY พบว่า พนักงานมากกว่า 9 ใน 10 เสียเวลานับ 8 ชั่วโมงต่อสัปดาห์ในการหาข้อมูลในเอกสาร อีกทั้งวิธีการดั้งเดิมในการสร้างเอกสารใหม่ขึ้นมาก็ใช้เวลาโดยเฉลี่ย 3 ชั่วโมง และเกิดข้อผิดพลาดเรื่องเครื่องหมายวรรคตอน การสะกดคำ การพิมพ์ต่าง ๆ ในหลายจุดได้

IDP คืออะไร?
ระบบการประมวลผลเอกสารอัจฉริยะ (Intelligent document processing หรือ IDP) เป็นโซลูชันที่นำเทคโนโลยีต่าง ๆ อาทิ Computer vision, เทคโนโลยี Optical character recognition หรือ OCR (การอ่านอักขระด้วยแสง), Machine learning (ระบบเรียนรู้) และ Natural language processing (ระบบประมวลผลภาษาธรรมชาติ) มาใช้ทำให้เอกสารอยู่ในรูปแบบดิจิทัลและดึงข้อมูลออกมาใช้งานต่อได้
IDP สามารถตรวจสอบข้อมูลในเอกสารอย่างใบแจ้งราคา โดยตรวจสอบกับฐานข้อมูลหรือแหล่งข้อมูลดิจิทัลแหล่งอื่นเพื่อยืนยันความถูกต้อง นอกจากนี้ ระบบ IDP ยังสามารถคัดแยกเอกสารเป็นหมวดหมู่หรือเรียงตามการใช้งานเพื่อให้ข้อมูลเป็นระบบระเบียบมากขึ้น
ด้วยข้อดีของ IDP ที่ช่วยลดต้นทุนและเพิ่มเวลาแก่พนักงานในการทำงานอย่างอื่น ระบบ IDP จึงเป็นที่สนใจมากขึ้น โดยงานวิจัยของ KBV พบว่า ภายในปี 2027 มูลค่าตลาดของโซลูชัน IDP อาจแตะถึง 1.32 แสนล้านบาท โดยมีอัตราการเติบโตต่อปีเพิ่มขึ้น 26.2% จากปี 2021

IDP ทำงานอย่างไร?
งานวิจัยของ Wakefield ในปี 2016 พบว่า 73% ของเจ้าของธุรกิจและผู้มีอำนาจตัดสินใจในบริษัทที่มีพนักงานน้อยกว่า 500 คนนั้นพิมพ์เอกสารอย่างน้อย 4 ครั้งต่อวัน หลัก ๆ คือ การพิมพ์และสแกนเอกสารที่ใช้ในขั้นตอนธุรกิจเฉพาะกิจและที่ใช้ประกอบธุรกรรม
กระบวนการทำให้เป็นดิจิทัลเพียงอย่างเดียวไม่สามารถแก้ปัญหาตรงจุดนี้ได้ จึงต้องอาศัยระบบ IDP เข้ามาทำให้การประมวลผลข้อมูลในเอกสารเป็นอัตโนมัติ โดยทำให้ระบบเข้าใจว่าเอกสารมีเนื้อหาเกี่ยวกับอะไร ประกอบไปด้วยข้อมูลอะไรบ้าง เพื่อที่จะสามารถดึงข้อมูลและนำไปใช้งานต่อได้
แพลตฟอร์ม IDP เริ่มต้นด้วยการเก็บข้อมูลจากหลายประเภทเอกสาร จากนั้นจึงคัดแยกเป็นหมวด ๆ เช่น ชื่อลูกค้าหรือองค์กร เบอร์โทรศัพท์และลายเซ็น เป็นต้น แล้วจึงตรวจสอบยืนยันข้อมูลก่อนที่จะไปผนวกเข้ากับระบบที่ต้องการ เช่น ซอฟต์แวร์ CRM หรือ ERP

ระบบ IDP จะรู้จักข้อมูลในเอกสารได้ 2 วิธี คือ OCR และ Handwritten-text recognition (ระบบรู้จำข้อความลายมือ) ส่วนการเข้าใจภาพหรือเนื้อหาที่อยู่ในภาพนั้น Computer vision จะเข้ามามีบทบาทตรงจุดนี้ ซึ่งอัลกอริธึมของ Computer vision ได้ผ่านการฝึกให้รู้จักชุดข้อมูลและเข้าใจแพทเทิร์นของข้อมูลดังกล่าวได้ เช่น ระบบสามารถแยกแยะระหว่างภาพสุนัขกับแมวจากการได้รับป้อนฐานข้อมูลขนาดใหญ่ของภาพแมวและสุนัขที่มีคำบรรยายภาพกำกับไว้ก่อนแล้ว
แม้ว่า OCR, Handwritten-text recognition และ Computer vision จะมีอคติที่กระทบต่อความแม่นยำอยู่บ้าง แต่ความสามารถในการคาดการณ์ เช่น รู้ว่าบาร์โค้ดกับใบแจ้งยอดมีรูปแบบที่แน่ชัดอยู่แล้ว ก็เหมาะสมกับการใช้งานในระบบ IDP
ส่วนอัลกอริธึมอื่นที่ประมวลผลขั้นตอนช่วงท้าย ได้แก่ การปรับความสว่างและการลบตัดทอนรอยหมึกรอยเปื้อนจากเอกสาร สำหรับการทำความเข้าใจข้อความนั้นเป็นหน้าที่ของการประมวลผลภาษาธรรมชาติหรือ NLP การทำงานของ NLP ก็เช่นเดียวกับ Computer vision ที่เข้าใจข้อความจากการดูตัวอย่างหลาย ๆ ชุดจำนวนมหาศาล ทั้งจากโซเชียลมีเดีย วิกิพีเดีย หนังสือ แพลตฟอร์มโฮสต์ซอฟต์แวร์อย่าง GitHub และแหล่งอื่น ๆ บนเว็บไซต์ทั่วไป ดังนั้น การประมวลผลเอกสารที่มี NLP อยู่เบื้องหลังจะช่วยให้พนักงานสามารถค้นหาข้อความที่ต้องการในเอกสาร หรือดูแนวโน้มและการเปลี่ยนแปลงในเอกสารได้

ขั้นตอนสุดท้ายของ IDP เกี่ยวข้องกับกระบวนการอัตโนมัติ (Robotic process automation หรือ RPA) ซึ่งก็คือเทคโนโลยี AI ที่ทำให้งานที่แต่เดิมใช้คนทำนั้นกลายเป็นอัตโนมัติด้วยหุ่นยนต์ซอฟต์แวร์ที่ทำงานร่วมกับระบบขององค์กร ตั้งแต่การย้ายไฟล์จากฐานข้อมูลหนึ่งสู่อีกฐานข้อมูลหนึ่ง ไปจนถึงการคัดลอกข้อความจากเอกสารไปในอีเมลแล้วส่งต่อได้ การใช้ RPA จึงช่วยให้องค์กรสามารถสร้างรายงานโดยอัตโนมัติจากเอกสารที่ผ่านการประมวลผลมาแล้ว และลดข้อมูลซ้ำซ้อนในไฟล์และโปรแกรมต่าง ๆ ได้ด้วย
บริษัทเทคโนโลยีรายใหญ่ต่างประยุกต์ใช้ IDP ในหลากหลายรูปแบบ เช่น Microsoft ใช้ IDP ดึงข้อมูลจากอีเมล ข้อความและเอกสารมาใส่ไว้ในฐานความรู้ ด้าน Amazon Web Services มีบริการ Textract ที่เข้าใจไฟล์สแกน PDF ภาพต่าง ๆ และป้อนข้อมูลใส่ระบบอื่นได้ ส่วน Google ก็ให้บริการ DocAI ซึ่งเป็นชุดเครื่องมือจัดการเอกสารด้วยระบบ AI ผ่านทาง API ด้วย

IDP กับผลลัพธ์ที่คุ้มค่า
ตามรายงานของ IDC ระบุว่า พนักงาน 42% เห็นตรงกันว่า งานเอกสารกระดาษทำให้เสียเวลาและประสิทธิภาพการทำงานในแต่ละวัน อีกทั้งรายงานของ Foxit Software ยังชี้ให้เห็นว่า บริษัทมากกว่า 2 ใน 3 ต้องการกระบวนการทำงานแบบไร้กระดาษเพิ่มขึ้นในช่วงสถานการณ์การแพร่ระบาดของ COVID-19 เช่นนี้
ถึงแม้ว่าการนำระบบ IDP มาใช้อาจต้องมีการกำหนดกลยุทธ์และเป้าหมายทางธุรกิจที่ชัดเจน และมอบหมายผู้รับผิดชอบในการนำเทคโนโลยีดังกล่าวมาใช้ แต่แน่นอนว่าระบบ IDP จะช่วยพลิกโฉมวิธีการทำธุรกิจ ที่สำคัญคือการประหยัดต้นทุนในกระบวนการทำงาน ดังที่ Lewis Walker จาก Deloitte ชี้ว่า เอกสารทั้งแบบกึ่งมีโครงสร้างและไม่มีโครงสร้างก็สามารถประมวลผลอัตโนมัติได้เร็วขึ้นด้วยความแม่นยำที่สูงขึ้น อันนำไปสู่ความพึงพอใจของลูกค้า ยิ่งผู้นำธุรกิจปรับตัวขยายเพื่อความได้เปรียบทางธุรกิจในยุคที่ให้ความสำคัญกับระบบอัตโนมัติ ยิ่งต้องปลดล็อกโอกาสที่เพิ่มมูลค่าด้วยการประมวลผลเอกสารให้มีประสิทธิภาพยิ่งขึ้น และแปลงข้อมูลเหล่านั้นให้กลายเป็นข้อมูลเชิงลึกได้เร็วกว่าที่เคย