1. สินค้า
  2.   OCR
  3.   Ruby
  4.   Ruby-Tesseract-OCR
 
  

ไลบรารี Ruby ขั้นสูงฟรีสำหรับโหลดและแยกข้อความจากรูปภาพ

Ruby OCR API โอเพ่นซอร์สชั้นนำและตัวแปลงรูปภาพเป็นข้อความที่ช่วยให้นักพัฒนาซอฟต์แวร์โหลด จดจำ และแยกข้อความจากรูปภาพ (รูปภาพที่สแกนและไฟล์ PDF)

การรู้จำอักขระด้วยแสง (OCR) เป็นเทคโนโลยีอันทรงพลังที่ช่วยให้คอมพิวเตอร์จดจำและแยกข้อความจากรูปภาพหรือเอกสารที่สแกนได้ มีการใช้งานมากมาย ตั้งแต่การแปลงสื่อสิ่งพิมพ์ให้เป็นดิจิทัลไปจนถึงกระบวนการป้อนข้อมูลอัตโนมัติ ในภาษาโปรแกรม Ruby ไลบรารียอดนิยมสำหรับ OCR คือ Ruby-Tesseract-OCR Ruby-Tesseract-OCR เป็นอัญมณี Ruby ที่ทำหน้าที่เป็นตัวห่อหุ้มสำหรับกลไก Tesseract OCR Tesseract เป็นเครื่องมือ OCR แบบโอเพ่นซอร์สที่พัฒนาโดย Google และมีชื่อเสียงในด้านความแม่นยำและการสนับสนุนด้านภาษา

Ruby-Tesseract-OCR เป็นมากกว่าความสามารถ OCR พื้นฐาน และนำเสนอคุณสมบัติเพิ่มเติมสำหรับกรณีการใช้งานขั้นสูง ตัวอย่างเช่น นักพัฒนาซอฟต์แวร์สามารถระบุภูมิภาคที่สนใจ (ROI) ภายในรูปภาพเพื่อจำกัดการวิเคราะห์ OCR ไว้ในพื้นที่เฉพาะ สิ่งนี้มีประโยชน์อย่างยิ่งเมื่อต้องจัดการกับเอกสารที่ซับซ้อนหรือเมื่อคุณต้องการแยกข้อความจากส่วนใดส่วนหนึ่งเท่านั้น ไลบรารีมีคุณลักษณะเพิ่มเติมหลายประการเพื่อปรับปรุงความสามารถของ OCR เช่น การโหลดรูปภาพที่มีอยู่ การแยกข้อความออกจากรูปภาพหรือเอกสารที่สแกน การรับเอาต์พุต HOCR (HTML OCR) และอื่นๆ อีกมากมาย

Ruby-Tesseract-OCR gem มอบอินเทอร์เฟซที่ใช้งานง่ายเพื่อโต้ตอบกับกลไก Tesseract ช่วยให้นักพัฒนา Ruby สามารถรวมความสามารถ OCR เข้ากับโปรเจ็กต์ของตนได้อย่างง่ายดาย ไม่ว่าคุณจะต้องดึงข้อมูลจากใบแจ้งหนี้ แปลงสื่อสิ่งพิมพ์เป็นดิจิทัล หรือทำงานป้อนข้อมูลอัตโนมัติ ไลบรารีโอเพ่นซอร์สมอบโซลูชันที่เชื่อถือได้และมีประสิทธิภาพ ทดลองใช้และปลดล็อกศักยภาพของ OCR ในโปรเจ็กต์ Ruby ของคุณเลยวันนี้

Previous Next

เริ่มต้นใช้งาน Ruby-Tesseract-OCR

วิธีที่แนะนำในการติดตั้ง Ruby-Tesseract-OCR คือการใช้ Rubygems โปรดใช้คำสั่งต่อไปนี้เพื่อการติดตั้งที่ราบรื่น

ติดตั้ง Ruby-Tesseract-OCR ผ่าน Rubygems

gem install tesseract-ocr 

คุณสามารถดาวน์โหลดไลบรารีที่ใช้ร่วมกันที่คอมไพล์แล้วได้จากที่เก็บ Github

แยกข้อความจากรูปภาพและเอกสารที่สแกนผ่าน Ruby

Ruby-Tesseract-OCR เป็นไลบรารีโอเพ่นซอร์สที่ทรงพลังมาก ซึ่งช่วยให้นักพัฒนาซอฟต์แวร์สามารถโหลดและแยกข้อความจากรูปภาพประเภทต่างๆ ด้วยโค้ด Ruby เพียงไม่กี่บรรทัด ไลบรารีทำให้ง่ายต่อการแยกข้อความจากรูปภาพ PDFS หรือเอกสารที่สแกน ขั้นตอนการทำงานทั่วไปเกี่ยวข้องกับการโหลดรูปภาพ การกำหนดค่าพารามิเตอร์ OCR และการเรียกใช้กลไก OCR เพื่อจดจำข้อความ เพื่อให้การดำเนินการประสบความสำเร็จ นักพัฒนาจำเป็นต้องจัดเตรียมเส้นทางไปยังรูปภาพที่ต้องการประมวลผล และเรียกใช้เมธอด text_for เพื่อแยกข้อความ สุดท้ายผลลัพธ์จะถูกพิมพ์ลงบนคอนโซล ไลบรารีเสนอตัวเลือก Fconfiguration ต่างๆ สำหรับควบคุมพฤติกรรม OCR เช่น โหมดการแบ่งส่วนหน้า อักขระไวท์ลิสต์ และอื่นๆ ตัวอย่างต่อไปนี้แสดงวิธีที่นักพัฒนาซอฟต์แวร์สามารถโหลดภาพ JPEG และแยกข้อความจากภาพนั้นภายในแอปพลิเคชัน Ruby

จะแยกข้อความจากรูปภาพโดยใช้คำสั่ง Ruby ได้อย่างไร

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

แยกข้อความจากพื้นที่รูปภาพเฉพาะผ่าน Ruby

ไลบรารีโอเพ่นซอร์ส Ruby-Tesseract-OCR เป็นมากกว่าความสามารถ OCR พื้นฐาน และนำเสนอคุณสมบัติเพิ่มเติมสำหรับกรณีการใช้งานขั้นสูง ตัวอย่างเช่น ผู้ใช้สามารถระบุภูมิภาคที่สนใจ (ROI) ภายในรูปภาพเพื่อจำกัดการวิเคราะห์ OCR ให้อยู่ในพื้นที่เฉพาะได้ สิ่งนี้มีประโยชน์อย่างยิ่งเมื่อต้องจัดการกับเอกสารที่ซับซ้อนหรือเมื่อผู้ใช้ต้องการแยกข้อความจากส่วนใดส่วนหนึ่งเท่านั้น นอกจากนี้ ไลบรารียังมีวิธีการรับเอาต์พุต HOCR (HTML OCR) ซึ่งไม่เพียงแต่รวมถึงข้อความที่รู้จักเท่านั้น แต่ยังรวมถึงข้อมูลเกี่ยวกับเค้าโครงและพิกัดขององค์ประกอบข้อความด้วย เอาต์พุต HOCR มีประโยชน์เมื่อคุณต้องการข้อมูลที่ละเอียดมากขึ้น หรือต้องการวิเคราะห์โครงสร้างข้อความเพิ่มเติม

จะดำเนินการ hOCR บนรูปภาพผ่าน Ruby Library ได้อย่างไร

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')
 ไทย