Geavanceerde gratis Ruby-bibliotheek om tekst uit afbeeldingen te laden en te extraheren

Een toonaangevende open source Ruby OCR API en Image to Text Converter waarmee softwareontwikkelaars tekst uit afbeeldingen kunnen laden, herkennen en extraheren (gescande afbeeldingen en PDF-bestanden)

Optische tekenherkenning (OCR) is een krachtige technologie waarmee computers tekst uit afbeeldingen of gescande documenten kunnen herkennen en extraheren. Het kent talloze toepassingen, variërend van het digitaliseren van drukwerk tot het automatiseren van gegevensinvoerprocessen. In de programmeertaal Ruby is Ruby-Tesseract-OCR een populaire bibliotheek voor OCR. Ruby-Tesseract-OCR is een Ruby-edelsteen die dient als verpakking voor de Tesseract OCR-engine. Tesseract is een open source OCR-engine ontwikkeld door Google en staat bekend om zijn nauwkeurigheid en taalondersteuning.

Ruby-Tesseract-OCR gaat verder dan de standaard OCR-mogelijkheden en biedt extra functies voor geavanceerde gebruiksscenario's. Softwareontwikkelaars kunnen bijvoorbeeld een interessegebied (ROI) binnen een afbeelding specificeren om de OCR-analyse tot een specifiek gebied te beperken. Dit is vooral handig als u met complexe documenten werkt of als u alleen tekst uit een specifieke sectie hoeft te halen. De bibliotheek biedt verschillende extra functies om de OCR-mogelijkheden te verbeteren, zoals het laden van een bestaande afbeelding, het extraheren van tekst uit afbeeldingen of gescande documenten, het verkrijgen van HOCR-uitvoer (HTML OCR) en nog veel meer.

De Ruby-Tesseract-OCR-edelsteen biedt een eenvoudig te gebruiken interface voor interactie met de Tesseract-engine, waardoor Ruby-ontwikkelaars OCR-mogelijkheden moeiteloos in hun projecten kunnen integreren. Of u nu informatie uit facturen wilt halen, gedrukt materiaal wilt digitaliseren of gegevensinvoer wilt automatiseren, de open source-bibliotheek biedt een betrouwbare en efficiënte oplossing. Probeer het eens en ontgrendel vandaag nog het potentieel van OCR in uw Ruby-projecten.

In één oogopslag

Een overzicht van Ruby-Tesseract-OCR-functies.

Kenmerkenoverzicht

Voer OCR uit
Voeg OCR-mogelijkheden toe
Herken afbeeldingstekst
Afbeeldingen laden via URL
PDF-tp-tekst converteren
Herkende lettertypetekst
PDF zoeken
Andere talen
Maak OCR-apps
Opslaan in browser
Tekst extraheren
Ondersteuning voor meerdere threads

Ruby-Tesseract-OCR

Ruby-Tesseract-OCR ondersteunt de populaire OCR-bestandsindelingen die hieronder worden vermeld.

Lezer

PNG, JPEG, BMP, TIFF, TGA, DICOM

auteur

PNG, JPEG, BMP, TIFF

Ruby-Tesseract-OCR

Platformonafhankelijkheid

Ruby-Tesseract-OCR vereist alleen Ruby Runtime.

Ruby 5.1 en hoger.

Ruby-Tesseract-OCR

Aan de slag met Ruby-Tesseract-OCR

De aanbevolen manier om Ruby-Tesseract-OCR te installeren is met behulp van Rubygems. Gebruik het volgende commando voor een vlotte installatie.

Installeer Ruby-Tesseract-OCR via Rubygems

gem install tesseract-ocr

Je kunt de gecompileerde gedeelde bibliotheek downloaden van de Github repository.

Extraheer tekst uit afbeeldingen en gescande documenten via Ruby

Ruby-Tesseract-OCR is een zeer krachtige open source-bibliotheek waarmee softwareontwikkelaars tekst uit verschillende soorten afbeeldingen kunnen laden en extraheren met slechts een paar regels Ruby-code. Met de bibliotheek kunt u eenvoudig tekst uit afbeeldingen, PDF's of gescande documenten extraheren. De typische workflow omvat het laden van een afbeelding, het configureren van de OCR-parameters en het aanroepen van de OCR-engine om de tekst te herkennen. Voor een succesvolle bewerking moeten ontwikkelaars het pad opgeven naar de afbeelding die ze willen verwerken en de methode text_for aanroepen om de tekst te extraheren. Ten slotte wordt het resultaat naar de console afgedrukt. De bibliotheek biedt verschillende F-configuratieopties voor het beheren van het OCR-gedrag, zoals paginasegmentatiemodus, tekens op de witte lijst en meer. De volgende voorbeelden laten zien hoe softwareontwikkelaars een JPEG-afbeelding kunnen laden en er tekst uit kunnen extraheren in Ruby-toepassingen.

Hoe tekst uit afbeeldingen extraheren met Ruby-opdrachten?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

Extraheer tekst uit een bepaald afbeeldingsgebied via Ruby

De open source Ruby-Tesseract-OCR-bibliotheek gaat verder dan de standaard OCR-mogelijkheden en biedt extra functies voor geavanceerde gebruiksscenario's. Gebruikers kunnen bijvoorbeeld een interessegebied (ROI) binnen een afbeelding specificeren om de OCR-analyse tot een specifiek gebied te beperken. Dit is vooral handig bij het omgaan met complexe documenten of wanneer gebruikers alleen tekst uit een specifieke sectie hoeven te halen. Bovendien biedt de bibliotheek methoden voor het verkrijgen van HOCR-uitvoer (HTML OCR), die niet alleen de herkende tekst bevat, maar ook informatie over de lay-out en coördinaten van de tekstelementen. HOCR-uitvoer is handig als u gedetailleerdere gegevens nodig heeft of een verdere analyse van de tekststructuur wilt uitvoeren.

Hoe voer ik hOCR uit op een afbeelding via Ruby Library?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')