Erweiterte kostenlose Ruby-Bibliothek zum Laden und Extrahieren von Text aus Bildern

Eine führende Open-Source-Ruby-OCR-API und ein Bild-zu-Text-Konverter, mit dem Softwareentwickler Text aus Bildern (gescannte Bilder und PDF-Dateien) laden, erkennen und extrahieren können.

Optische Zeichenerkennung (OCR) ist eine leistungsstarke Technologie, die es Computern ermöglicht, Text aus Bildern oder gescannten Dokumenten zu erkennen und zu extrahieren. Sie hat zahlreiche Anwendungen, von der Digitalisierung von Drucksachen bis hin zur Automatisierung von Dateneingabeprozessen. In der Programmiersprache Ruby ist Ruby-Tesseract-OCR eine beliebte Bibliothek für OCR. Ruby-Tesseract-OCR ist ein Ruby-Gem, das als Wrapper für die Tesseract OCR-Engine dient. Tesseract ist eine Open-Source-OCR-Engine, die von Google entwickelt wurde und für ihre Genauigkeit und Sprachunterstützung bekannt ist.

Ruby-Tesseract-OCR geht über grundlegende OCR-Funktionen hinaus und bietet zusätzliche Funktionen für fortgeschrittene Anwendungsfälle. Beispielsweise können Softwareentwickler einen Interessenbereich (ROI) innerhalb eines Bildes angeben, um die OCR-Analyse auf einen bestimmten Bereich zu beschränken. Dies ist besonders nützlich, wenn Sie mit komplexen Dokumenten arbeiten oder wenn Sie nur Text aus einem bestimmten Abschnitt extrahieren müssen. Die Bibliothek bietet mehrere zusätzliche Funktionen zur Verbesserung der OCR-Funktionen, z. B. das Laden eines vorhandenen Bilds, das Extrahieren von Text aus Bildern oder gescannten Dokumenten, das Erhalten von HOCR-Ausgaben (HTML OCR) und vieles mehr.

Das Ruby-Tesseract-OCR-Gem bietet eine benutzerfreundliche Schnittstelle zur Interaktion mit der Tesseract-Engine, sodass Ruby-Entwickler OCR-Funktionen mühelos in ihre Projekte integrieren können. Ob Sie Informationen aus Rechnungen extrahieren, gedruckte Materialien digitalisieren oder Dateneingabeaufgaben automatisieren müssen, die Open-Source-Bibliothek bietet eine zuverlässige und effiziente Lösung. Probieren Sie es aus und schöpfen Sie noch heute das Potenzial von OCR in Ihren Ruby-Projekten aus.

Auf einen Blick

Eine Übersicht über die Ruby-Tesseract-OCR-Funktionen.

Funktionsübersicht

OCR ausführen
OCR-Funktionen hinzufügen
Bildtext erkennen
Bilder über URL laden
PDF in Text konvertieren
Erkannter Schrifttext
PDF durchsuchen
Andere Sprachen
OCR-Apps erstellen
Im Browser speichern
Text extrahieren
Multithreading-Unterstützung

Ruby-Tesseract-OCR

Ruby-Tesseract-OCR unterstützt die unten aufgeführten gängigen OCR-Dateiformate.

Leserin

PNG, JPEG, BMP, TIFF, TGA, DICOM

Schriftstellerin

PNG, JPEG, BMP, TIFF

Ruby-Tesseract-OCR

Plattformunabhängigkeit

Ruby-Tesseract-OCR erfordert nur Ruby Runtime.

Ruby 5.1 und höher.

Ruby-Tesseract-OCR

Erste Schritte mit Ruby-Tesseract-OCR

Die empfohlene Methode zur Installation von Ruby-Tesseract-OCR ist die Verwendung von Rubygems. Bitte verwenden Sie den folgenden Befehl für eine reibungslose Installation.

Ruby-Tesseract-OCR über Rubygems installieren

gem install tesseract-ocr

Sie können die kompilierte gemeinsam genutzte Bibliothek vom Github-Repository herunterladen.

Text aus Bildern und gescannten Dokumenten mit Ruby extrahieren

Ruby-Tesseract-OCR ist eine sehr leistungsstarke Open-Source-Bibliothek, mit der Softwareentwickler mit nur ein paar Zeilen Ruby-Code Text aus verschiedenen Bildtypen laden und extrahieren können. Die Bibliothek erleichtert das Extrahieren von Text aus Bildern, PDFs oder gescannten Dokumenten. Der typische Arbeitsablauf umfasst das Laden eines Bildes, das Konfigurieren der OCR-Parameter und das Aufrufen der OCR-Engine zum Erkennen des Textes. Für einen erfolgreichen Vorgang müssen Entwickler den Pfad zum Bild angeben, das sie verarbeiten möchten, und die Methode text_for aufrufen, um den Text zu extrahieren. Schließlich wird das Ergebnis auf der Konsole ausgegeben. Die Bibliothek bietet verschiedene Konfigurationsoptionen zum Steuern des OCR-Verhaltens, z. B. Seitensegmentierungsmodus, Whitelist-Zeichen und mehr. Die folgenden Beispiele zeigen, wie Softwareentwickler ein JPEG-Bild laden und in Ruby-Anwendungen Text daraus extrahieren können.

Wie extrahiere ich mit Ruby-Befehlen Text aus Bildern?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

Text aus einem bestimmten Bildbereich über Ruby extrahieren

Die Open-Source-Bibliothek Ruby-Tesseract-OCR geht über grundlegende OCR-Funktionen hinaus und bietet zusätzliche Funktionen für erweiterte Anwendungsfälle. Beispielsweise können Benutzer einen Interessenbereich (ROI) innerhalb eines Bildes angeben, um die OCR-Analyse auf einen bestimmten Bereich zu beschränken. Dies ist besonders nützlich, wenn es um komplexe Dokumente geht oder wenn Benutzer nur Text aus einem bestimmten Abschnitt extrahieren müssen. Darüber hinaus bietet die Bibliothek Methoden zum Abrufen von HOCR-Ausgaben (HTML OCR), die nicht nur den erkannten Text, sondern auch Informationen zum Layout und den Koordinaten der Textelemente enthalten. HOCR-Ausgaben sind hilfreich, wenn Sie detailliertere Daten benötigen oder weitere Analysen der Textstruktur durchführen möchten.

Wie führe ich hOCR auf einem Bild über die Ruby-Bibliothek durch?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')