Home » บทความ » ทำความรู้จักกับเทคโนโลยี OCR ตัวช่วยประหยัดเวลาพิมพ์เอกสาร

ทำความรู้จักกับเทคโนโลยี OCR ตัวช่วยประหยัดเวลาพิมพ์เอกสาร

นอกจากการสแกนเอกสารที่นำตัวเอกสารจริงมาแปลงให้อยู่ในรูปแบบไฟล์ดิจิทัลและยังง่ายต่อการเรียกดูเอกสารที่สำนักงานนิยมใช้แล้ว การแปลงไฟล์ภาพเอกสารให้เป็นไฟล์ข้อความอัตโนมัติก็เป็นที่นิยมเช่นกันในแวดวงสำนักงาน ที่ต้องการจะประหยัดเวลาในการพิมพ์เอกสารใหม่ และง่ายต่อการค้นหามากยิ่งขึ้น ซึ่งการแปลงไฟล์ภาพเอกสารให้เป็นไฟล์ข้อความอัตโนมัติเรียกว่าการ OCR ที่ย่อมาจาก Optical Character การนำเอกสารมา OCR จะช่วยประหยัดพื้นที่ในการจัดเก็บข้อมูล เพราะไฟล์ที่ป็นไฟล์ข้อความจะมีขนาดเล็ก ทั้งยังสะดวกและง่ายต่อการแก้ไขหรือปรับแต่ง ไฟล์เล็กและแก้ไขได้ง่ายกว่าไฟล์ภาพ เมื่อสแกนแบบ OCR สามารถนำภาพที่ได้จากการสแกนไปใช้ในรูปแบบของ Word หรือ Excel ได้ทันที

สนใจบริการสแกนเอกสาร และบันทึกข้อมูล โทร.02-551-2097 กด 601

หลักการทำงานของเครื่องอ่านโอซีอาร์ (OCR)

อุปกรณ์โอซีอาร์ (Optical Character Recognition : OCR) เป็นอุปกรณ์ที่รับข้อมูลเข้าสู่ระบบได้โดยตรง โดยใช้เทคนิคในการอ่าน ค่าของข้อมูลด้วยแสง ทำหน้าที่เป็นแหล่งกำเนิดแสงและรับแสงสะท้อนที่ส่องผ่านกลับมาจากวัตถุ และแปลงรหัสข้อมูลให้อยู่ในรูปแบบที่เครื่อง คอมพิวเตอร์เข้าใจได้

อ่านเพิ่มเติมได้ที่ : ค้นหาไฟล์ภาพได้เร็วขึ้นด้วย OCR

ประเภทของอุปกรณ์โอซีอาร์

อุปกรณ์โอซีอาร์ แบ่งได้ตามลักษณะของข้อมูลที่จะนำเข้าได้ดังนี้

  1. โอเอ็มอาร์ (Optical Mark Readers : OMR) เป็นเครื่องที่สามารถอ่านรอยเครื่องหมาย ที่เกิดจากดินสอในกระดาษที่มีรูปแบบ เฉพาะ โดยเครื่องจะส่องไฟผ่านกระดาษที่อ่าน และจะสะท้อนแสงที่เกิดจากเครื่องหมาย ที่ทำขึ้นโดยดินสอ เนื่องจากรอยดินสอเกิดขึ้นจากดินสอ ที่มีตะกั่วอ่อน จึงเกิดการสะท้อนแสง ซึ่งมักใช้ในการตรวจข้อสอบเข้ามหาวิทยาลัย หรือการลงทะเบียน
  2. Wand Readers เป็นอุปกรณ์ที่ใช้มือควบคุม โดยจะนำอุปกรณ์นี้ส่องลำแสงไปยังตัวอักษรแบบพิเศษ เพื่อทำการแปลงตัวอักษรนั้นให้ เป็นสัญญาณไฟฟ้าและส่งไปให้คอมพิวเตอร์ประมวลผล จะเชื่อมต่อกับอุปกรณ์ที่เรียกว่า POS (Point-of-sale Terminal) โดยตัวอย่างของ เครื่อง POS นี้จะเห็นได้ทั่วไปในห้างสรรพสินค้า ที่ใช้สำหรับแสดงจำนวนเงินที่เคาน์เตอร์คิดเงิน
  3. Hand Written Character Device เป็นอุปกรณ์ที่สามารถอ่านข้อมูลที่เขียนด้วยลายมือได้ เพื่อลดขั้นตอนในการพิมพ์ด้วยแป้น พิมพ์เข้าสู่เครื่องคอมพิวเตอร์ แต่ลายมือที่เขียนจะต้องเป็นรูปแบบที่อ่านได้ง่ายไม่กำกวม
  4. Bar Code Reader มีลักษณะการใช้งานเหมือนกับเครื่อง Wand Readers แต่ใช้กับการอ่านรหัสแท่ง (Bar Code) ที่มี ลักษณะเป็นรหัสรูปแท่งเรียงกันเป็นแถวในแนวตั้ง เพื่อแปลรหัสแท่งนี้ให้กลายเป็นข้อมูลที่คอมพิวเตอร์เข้าใจ

ซึ่งจำนวนเอกสารของทุกสำนักงานมีแนวโน้มที่จะเพิ่มขึ้นเรื่อย ๆ อย่างมหาศาลแน่นอน หากไม่มีโอซีอาร์ก็อาจจะต้องเสียเวลาในการนั่งพิมพ์เอกสารเป็นเวลานาน เรียกได้ว่าแทบจะทุกธุรกิจสามารถได้ประโยชน์จากเทคโนโลยีโอซีอาร์เพื่อประสิทธิภาพการทำงานที่ดียิ่งขึ้น ทุกธุรกิจล้วนสามารถใช้การโอซีอาร์เพื่อปรับปรุงธุรกิจและขจัดความจำเป็นในการจัดทำและจัดเก็บเอกสารกระดาษด้วย

ประเภทของการทำ OCR

การทำ OCR จะแบ่งออกได้ 2 ประเภท

  1. การรู้จำอักษรแบบออนไลน์ (On-line Character Recognition) โดยการรู้จำอักษรแบบออนไลน์การโอซีอาร์ประเภทนี้จะง่ายกว่าการรู้จำอักษรแบบออฟไลน์ เพราะการโอซีอาร์ออนไลน์มักมาพร้อมกับอุปกรณ์การเขียนหรือปากกาอิเล็กทรอนิกส์นั่นเอง ช่วยให้การจำรู้ลายมือเขียนง่ายจากทิศทางการลากเส้นตัวอักษรทำให้ง่ายต่อการอ่านตัวอักษร จะเห็นได้ทั่วไปในปัจจุบันอย่างเช่น เมื่อมีพัสดุมาส่งเจ้าหน้าที่ผู้มาส่งของมักจะให้เราเซ็นยืนยันรับของที่มาส่งผ่านอุปกรณ์อิเล็กทรอนิกส์เพื่อความสะดวก และรวดเร็วในการทำงานของขนส่งนั่นเอง
  2. การรู้จำอักษรแบบออฟไลน์ (Off-line Character Recognition) โดยการรู้จำอักษรแบบออฟไลน์เป็นการนำภาพตัวอักษร แบบพิมพ์หรือแบบเขียนที่ได้จากเครื่องสแกน โดยจะมีทั้งตัวอักษรแบบติดกันเป็นกลุ่มตัวอักษร และอักษรแบบเดี่ยว การทำงานของการโอซีอาร์นั้น ก่อนที่โปรแกรมจะสามารถบอกได้ว่ารูปภาพที่ส่งเข้าไปประกอบด้วยตัวอักษรอะไรบ้าง ก็จะต้องผ่านขั้นตอนที่สำคัญหลายขั้น เป็นขั้นตอนในการปรับแต่งและจัดเตรียมข้อมูลให้เหมาะสมกับขั้นตอนการรู้จำต่อไป ขั้นตอนเหล่านี้มีความสำคัญต่อประสิทธิภาพโดยรวมของระบบ เพราะหากมีความผิดพลาดเกิดขึ้นในส่วนนี้ ก็จะส่งผลกระทบไปยังส่วนถัดไปของระบบด้วย และการรู้จำจะเป็นขั้นตอนที่ถือเป็นหัวใจของการโอซีอาร์ เพราะเป็นส่วนที่จะแสดงออกว่ารูปตัวอักษรเป็นอักษรอะไร แต่การที่ตัวอักษรที่ถูกส่งเข้าไปจะได้ผลลัพธ์ออกมาซึ่งก็ไม่ได้หมายความว่าเอาท์พุตที่ได้มาจะถูกต้องทั้งหมด 100 % เพื่อเพิ่มความถูกต้องผู้ใช้โปรแกรมจึงสามารถตรวจสอบและแก้ไขข้อความได้ โปรแกรมมักจะทำงานเกี่ยวกับการตรวจสอบความถูกต้องของการสะกดคำและไวยากรณ์ภาษา ซึ่งอาจแก้ไขให้โดยอัตโนมัติหรือแสดงเครื่องหมายบางอย่างเพื่อบอกให้ผู้ใช้ทราบว่าคำนี้อาจไม่ถูกต้อง แต่ก็ขึ้นอยู่กับผู้ใช้งานอีกเช่นกันว่าต้องการแก้ไขคำเหล่านี้ที่โปรแกรมแจ้งเตือนหรือไม่

สรุป

การทำงานของระบบ OCR ช่วยประหยัดเวลาในการทำงานได้มากทีเดียว ถ้าหากเป็นแอพพลิเคชั่นที่ใกล้ตัวเราเลยและสามารถทำการโอซีอาร์แปลงภาพให้ออกมาอยู่ในรูปแบบข้อความได้ก็คือ แอพพลิเคชั่นไลน์นั่นเองที่สามารถทำการโอซีอาร์ได้ง่ายและสะดวกมากๆ

ในยุคสมัยใหม่นี้การเลิกใช้เอกสารกระดาษถือว่ากำลังมาให้กลุ่มสำนักงานที่พยายามจะลดใช้กระดาษเพื่อให้สอดคล้องกระแสยุคดิจิทัล 4.0 กำลังเป็นที่ติดหูของใครหลายคน เพราะกระดาษเป็นสิ่งที่ใช้คู่กับการทำงานมานานแสนนาน แต่ว่าการใช้กระดาษนั้นมีต้นทุนที่สูง อีกทั้งยังสิ้นเปลืองทรัพยากรของออฟฟิศทั้งทางตรงและทางอ้อม ด้วยการเปลี่ยนเป็น Paperless office เทคโนโลยีที่ก้าวไกลมีแต่จะอำนวยความสะดวกให้กับผู้คนมากขึ้น ลดแรงงานคนในการทำงานต่างๆ คุณภาพชีวิตที่ดีเทคโนโลยีมีบทบาทในชีวิตประจำวันของทุกคนที่เกิดมาในยุคนี้ นี่คงเป็นข้อดีของเทคโนโลยีที่ถูกพัฒนามาอย่างต่อเนื่อง แล้วยังก้าวล้ำไปเรื่อยๆ อีก ผู้คนทันโลกมากขึ้นเข้าถึงข้อมูลข่าวสาร และเทคโนโลยีนวัติกรรมใหม่ๆ ได้ง่ายขึ้น