Geavanceerde gratis Ruby-bibliotheek om tekst uit afbeeldingen te laden en te extraheren
Een toonaangevende open source Ruby OCR API en Image to Text Converter waarmee softwareontwikkelaars tekst uit afbeeldingen kunnen laden, herkennen en extraheren (gescande afbeeldingen en PDF-bestanden)
Optische tekenherkenning (OCR) is een krachtige technologie waarmee computers tekst uit afbeeldingen of gescande documenten kunnen herkennen en extraheren. Het kent talloze toepassingen, variërend van het digitaliseren van drukwerk tot het automatiseren van gegevensinvoerprocessen. In de programmeertaal Ruby is Ruby-Tesseract-OCR een populaire bibliotheek voor OCR. Ruby-Tesseract-OCR is een Ruby-edelsteen die dient als verpakking voor de Tesseract OCR-engine. Tesseract is een open source OCR-engine ontwikkeld door Google en staat bekend om zijn nauwkeurigheid en taalondersteuning.
Ruby-Tesseract-OCR gaat verder dan de standaard OCR-mogelijkheden en biedt extra functies voor geavanceerde gebruiksscenario's. Softwareontwikkelaars kunnen bijvoorbeeld een interessegebied (ROI) binnen een afbeelding specificeren om de OCR-analyse tot een specifiek gebied te beperken. Dit is vooral handig als u met complexe documenten werkt of als u alleen tekst uit een specifieke sectie hoeft te halen. De bibliotheek biedt verschillende extra functies om de OCR-mogelijkheden te verbeteren, zoals het laden van een bestaande afbeelding, het extraheren van tekst uit afbeeldingen of gescande documenten, het verkrijgen van HOCR-uitvoer (HTML OCR) en nog veel meer.
De Ruby-Tesseract-OCR-edelsteen biedt een eenvoudig te gebruiken interface voor interactie met de Tesseract-engine, waardoor Ruby-ontwikkelaars OCR-mogelijkheden moeiteloos in hun projecten kunnen integreren. Of u nu informatie uit facturen wilt halen, gedrukt materiaal wilt digitaliseren of gegevensinvoer wilt automatiseren, de open source-bibliotheek biedt een betrouwbare en efficiënte oplossing. Probeer het eens en ontgrendel vandaag nog het potentieel van OCR in uw Ruby-projecten.
Aan de slag met Ruby-Tesseract-OCR
De aanbevolen manier om Ruby-Tesseract-OCR te installeren is met behulp van Rubygems. Gebruik het volgende commando voor een vlotte installatie.
Installeer Ruby-Tesseract-OCR via Rubygems
gem install tesseract-ocr
Je kunt de gecompileerde gedeelde bibliotheek downloaden van de Github repository.
Extraheer tekst uit afbeeldingen en gescande documenten via Ruby
Ruby-Tesseract-OCR is een zeer krachtige open source-bibliotheek waarmee softwareontwikkelaars tekst uit verschillende soorten afbeeldingen kunnen laden en extraheren met slechts een paar regels Ruby-code. Met de bibliotheek kunt u eenvoudig tekst uit afbeeldingen, PDF's of gescande documenten extraheren. De typische workflow omvat het laden van een afbeelding, het configureren van de OCR-parameters en het aanroepen van de OCR-engine om de tekst te herkennen. Voor een succesvolle bewerking moeten ontwikkelaars het pad opgeven naar de afbeelding die ze willen verwerken en de methode text_for aanroepen om de tekst te extraheren. Ten slotte wordt het resultaat naar de console afgedrukt. De bibliotheek biedt verschillende F-configuratieopties voor het beheren van het OCR-gedrag, zoals paginasegmentatiemodus, tekens op de witte lijst en meer. De volgende voorbeelden laten zien hoe softwareontwikkelaars een JPEG-afbeelding kunnen laden en er tekst uit kunnen extraheren in Ruby-toepassingen.
Hoe tekst uit afbeeldingen extraheren met Ruby-opdrachten?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
e.text_for('test/first.png').strip # => 'ABC'
Extraheer tekst uit een bepaald afbeeldingsgebied via Ruby
De open source Ruby-Tesseract-OCR-bibliotheek gaat verder dan de standaard OCR-mogelijkheden en biedt extra functies voor geavanceerde gebruiksscenario's. Gebruikers kunnen bijvoorbeeld een interessegebied (ROI) binnen een afbeelding specificeren om de OCR-analyse tot een specifiek gebied te beperken. Dit is vooral handig bij het omgaan met complexe documenten of wanneer gebruikers alleen tekst uit een specifieke sectie hoeven te halen. Bovendien biedt de bibliotheek methoden voor het verkrijgen van HOCR-uitvoer (HTML OCR), die niet alleen de herkende tekst bevat, maar ook informatie over de lay-out en coördinaten van de tekstelementen. HOCR-uitvoer is handig als u gedetailleerdere gegevens nodig heeft of een verdere analyse van de tekststructuur wilt uitvoeren.
Hoe voer ik hOCR uit op een afbeelding via Ruby Library?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
puts e.hocr_for('test/first.png')