1. Produkte
  2.   OCR
  3.   Ruby
  4.   Ruby-Tesseract-OCR
 
  

Erweiterte kostenlose Ruby-Bibliothek zum Laden und Extrahieren von Text aus Bildern

Eine führende Open-Source-Ruby-OCR-API und Bild-zu-Text-Konverter, die es Softwareentwicklern ermöglicht, Text aus Bildern (gescannten Bildern und PDF-Dateien) zu laden, zu erkennen und zu extrahieren.

Optische Zeichenerkennung (OCR) ist eine leistungsstarke Technologie, die es Computern ermöglicht, Text aus Bildern oder gescannten Dokumenten zu erkennen und zu extrahieren. Es gibt zahlreiche Anwendungen, die von der Digitalisierung gedruckter Materialien bis zur Automatisierung von Dateneingabeprozessen reichen. In der Programmiersprache Ruby ist Ruby-Tesseract-OCR eine beliebte Bibliothek für OCR. Ruby-Tesseract-OCR ist ein Ruby-Gem, das als Wrapper für die Tesseract OCR-Engine dient. Tesseract ist eine von Google entwickelte Open-Source-OCR-Engine, die für ihre Genauigkeit und Sprachunterstützung bekannt ist.

Ruby-Tesseract-OCR geht über die grundlegenden OCR-Funktionen hinaus und bietet zusätzliche Funktionen für erweiterte Anwendungsfälle. Softwareentwickler können beispielsweise eine Region of Interest (ROI) innerhalb eines Bildes angeben, um die OCR-Analyse auf einen bestimmten Bereich zu beschränken. Dies ist besonders nützlich, wenn Sie mit komplexen Dokumenten arbeiten oder nur Text aus einem bestimmten Abschnitt extrahieren müssen. Die Bibliothek bietet mehrere zusätzliche Funktionen zur Verbesserung der OCR-Funktionen, z. B. das Laden eines vorhandenen Bildes, das Extrahieren von Text aus Bildern oder gescannten Dokumenten, das Erhalten einer HOCR-Ausgabe (HTML OCR) und vieles mehr.

Das Ruby-Tesseract-OCR-Gem bietet eine benutzerfreundliche Schnittstelle für die Interaktion mit der Tesseract-Engine und ermöglicht Ruby-Entwicklern die mühelose Integration von OCR-Funktionen in ihre Projekte. Unabhängig davon, ob Sie Informationen aus Rechnungen extrahieren, gedruckte Materialien digitalisieren oder Dateneingabeaufgaben automatisieren müssen, bietet die Open-Source-Bibliothek eine zuverlässige und effiziente Lösung. Probieren Sie es aus und nutzen Sie noch heute das Potenzial von OCR in Ihren Ruby-Projekten.

Previous Next

Erste Schritte mit Ruby-Tesseract-OCR

Die empfohlene Methode zur Installation von Ruby-Tesseract-OCR ist die Verwendung von Rubygems. Für eine reibungslose Installation verwenden Sie bitte den folgenden Befehl.

Installieren Sie Ruby-Tesseract-OCR über Rubygems

gem install tesseract-ocr 

Sie können die kompilierte gemeinsam genutzte Bibliothek aus dem Github-Repository herunterladen.

Text aus Bildern und gescannten Dokumenten mit Ruby extrahieren

Ruby-Tesseract-OCR ist eine sehr leistungsstarke Open-Source-Bibliothek, die es Softwareentwicklern ermöglicht, mit nur wenigen Zeilen Ruby-Code Text aus verschiedenen Bildtypen zu laden und zu extrahieren. Die Bibliothek erleichtert das Extrahieren von Text aus Bildern, PDFs oder gescannten Dokumenten. Der typische Arbeitsablauf umfasst das Laden eines Bildes, das Konfigurieren der OCR-Parameter und das Aufrufen der OCR-Engine zur Texterkennung. Für einen erfolgreichen Vorgang müssen Entwickler den Pfad zu dem Bild angeben, das sie verarbeiten möchten, und die Methode text_for aufrufen, um den Text zu extrahieren. Abschließend wird das Ergebnis auf der Konsole ausgegeben. Die Bibliothek bietet verschiedene F-Konfigurationsoptionen zur Steuerung des OCR-Verhaltens, wie z. B. Seitensegmentierungsmodus, Whitelist-Zeichen und mehr. Die folgenden Beispiele zeigen, wie Softwareentwickler in Ruby-Anwendungen ein JPEG-Bild laden und Text daraus extrahieren können.

Wie extrahiere ich Text aus Bildern mit Ruby-Befehlen?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

Extrahieren Sie Text aus einem bestimmten Bildbereich mit Ruby

Die Open-Source-Bibliothek Ruby-Tesseract-OCR geht über die grundlegenden OCR-Funktionen hinaus und bietet zusätzliche Funktionen für erweiterte Anwendungsfälle. Beispielsweise können Benutzer eine Region of Interest (ROI) innerhalb eines Bildes angeben, um die OCR-Analyse auf einen bestimmten Bereich zu beschränken. Dies ist besonders nützlich, wenn es um komplexe Dokumente geht oder wenn Benutzer nur Text aus einem bestimmten Abschnitt extrahieren müssen. Darüber hinaus bietet die Bibliothek Methoden zum Erhalten einer HOCR-Ausgabe (HTML OCR), die nicht nur den erkannten Text, sondern auch Informationen über das Layout und die Koordinaten der Textelemente enthält. Die HOCR-Ausgabe ist hilfreich, wenn Sie detailliertere Daten benötigen oder eine weitere Analyse der Textstruktur durchführen möchten.

Wie führe ich hOCR für ein Bild über die Ruby-Bibliothek durch?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')
 Deutsch