Open Source Ruby Library เพื่อแปลงรูปภาพเป็นข้อความออนไลน์
ไลบรารี Ruby Optical Character Recognition (OCR) ฟรีช่วยให้นักพัฒนาซอฟต์แวร์โหลด อ่าน และแปลงรูปภาพ PDF หรือเอกสารที่สแกนเป็นข้อความหรือเอกสารที่ค้นหาได้
เทคโนโลยีการรู้จำอักขระด้วยแสง (OCR) มีความก้าวหน้าอย่างมากในช่วงไม่กี่ปีที่ผ่านมา ทำให้การดึงข้อมูลจากแหล่งต่างๆ เป็นแบบอัตโนมัติได้ง่ายขึ้น ช่วยให้สามารถทำงานอัตโนมัติ ปรับปรุงการเข้าถึงข้อมูล และเพิ่มผลผลิตในโดเมนต่างๆ เครื่องมืออันทรงพลังอย่างหนึ่งคือไลบรารี OcrSpace Ruby ซึ่งมอบโซลูชันที่ตรงไปตรงมาสำหรับนักพัฒนาในการรวมความสามารถ OCR เข้ากับแอปพลิเคชัน Ruby ของพวกเขา ไลบรารีนี้ทำให้กระบวนการแยกข้อความจากรูปภาพ เอกสารที่สแกน และไฟล์ PDF ง่ายขึ้น ทำให้เป็นตัวเลือกที่ยอดเยี่ยมสำหรับนักพัฒนาที่กำลังมองหาโซลูชัน OCR ที่สะดวกสบาย
ไลบรารี OcrSpace Ruby นำเสนออินเทอร์เฟซที่ตรงไปตรงมาและใช้งานง่าย ทำให้ง่ายต่อการรวมความสามารถ OCR เข้ากับแอปพลิเคชัน Ruby ไลบรารีมีคุณสมบัติที่สำคัญหลายประการ เช่น การโหลดรูปภาพประเภทต่างๆ การแยกข้อความจากรูปภาพ การแปลงเอกสารที่สแกนเป็นข้อความ การแยกข้อความจากเอกสารที่เขียนในหลายภาษา การจดจำข้อความจากรูปภาพความละเอียดต่ำ การทำงานกับเนื้อหาที่เขียนด้วยลายมือ , การดึงพิกัดของข้อความที่รู้จัก การตรวจจับหมายเลขหน้า การระบุพื้นที่เฉพาะที่สนใจ และอื่นๆ อีกมากมาย
ไลบรารี OcrSpace Ruby เป็นส่วนล้อมรอบ Ocr.Space OCR API ซึ่งนำเสนอการแยกข้อความที่เชื่อถือได้และแม่นยำจากรูปภาพและเอกสาร PDF สร้างขึ้นสำหรับนักพัฒนา Ruby โดยเฉพาะ ไลบรารีนี้ทำให้กระบวนการบูรณาการง่ายขึ้น ช่วยให้โปรแกรมเมอร์สามารถรวมฟังก์ชัน OCR เข้ากับแอปพลิเคชันของตนได้อย่างรวดเร็ว โดยไม่ต้องจัดการกับความซับซ้อนของ API พื้นฐาน ไม่ว่าคุณกำลังสร้างระบบการจัดการเอกสาร การแยกข้อมูลอัตโนมัติ หรือเพิ่มความสามารถในการเข้าถึง ไลบรารี OcrSpace Ruby เป็นเครื่องมืออันล้ำค่าที่ช่วยปรับปรุงกระบวนการ OCR และเพิ่มศักยภาพให้กับแอปพลิเคชันของคุณด้วยความสามารถในการแยกข้อความที่แม่นยำ
เริ่มต้นใช้งาน OcrSpace
วิธีที่แนะนำในการติดตั้ง OcrSpace คือการใช้ Rubygems โปรดใช้คำสั่งต่อไปนี้เพื่อการติดตั้งที่ราบรื่น
ติดตั้ง OcrSpace ผ่าน Rubygems
$ gem install ocr_space
คุณสามารถดาวน์โหลดไลบรารีที่ใช้ร่วมกันที่คอมไพล์แล้วได้จากที่เก็บ Github
แปลงรูปภาพจาก URL เป็นข้อความผ่าน Ruby API
ไลบรารี OcrSpace แบบโอเพ่นซอร์สได้รวมคุณสมบัติที่มีประสิทธิภาพสำหรับการโหลดรูปภาพประเภทต่างๆ และแปลงเป็นข้อความด้วยโค้ด Ruby สองสามบรรทัด ไลบรารีรองรับตัวเลือก OCR หลากหลาย รวมถึงการแยกข้อความจากรูปภาพ เอกสารที่สแกน และไฟล์ PDF ไม่ว่านักพัฒนาซอฟต์แวร์จะต้องประมวลผลใบแจ้งหนี้ ใบเสร็จรับเงิน หรือเอกสารประเภทอื่นใด ไลบรารี OcrSpace Ruby ก็สามารถจัดการได้อย่างมีประสิทธิภาพ ตัวอย่างต่อไปนี้แสดงวิธีที่นักพัฒนาซอฟต์แวร์สามารถแปลงรูปภาพเป็นข้อความผ่าน URL โดยใช้ Ruby API
แปลงรูปภาพจาก URL ผ่าน Ruby API
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
ความสามารถ OCR ขั้นสูงผ่าน Ruby API
ไลบรารี OcrSpace แบบโอเพ่นซอร์สได้รวมคุณสมบัติที่มีประโยชน์และขั้นสูงบางอย่างสำหรับการจัดการการดำเนินการ OCR ภายในแอปพลิเคชัน Ruby สามารถจดจำข้อความจากรูปภาพความละเอียดต่ำ ข้อความที่บิดเบี้ยว และแม้แต่เนื้อหาที่เขียนด้วยลายมือได้อย่างแม่นยำ ทำให้มั่นใจได้ถึงผลลัพธ์ที่เชื่อถือได้ในสถานการณ์ต่างๆ นอกเหนือจากการแยกข้อความแล้ว ไลบรารียังช่วยให้นักพัฒนาดึงข้อมูลสำคัญอื่นๆ จากเอกสารได้อีกด้วย ซึ่งรวมถึงการดึงพิกัดของข้อความที่รู้จัก การตรวจจับหมายเลขหน้า และการระบุพื้นที่เฉพาะที่น่าสนใจภายในเอกสาร
จะแยกข้อความจากไฟล์ที่อัพโหลดผ่าน Ruby API ได้อย่างไร
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result