1. Продукти
  2.   OCR
  3.   Ruby
  4.   OcrSpace
 
  

Open-Source-Ruby-Bibliothek zum Online-Konvertieren von Bildern in Text

Kostenlose Ruby-Bibliothek zur optischen Zeichenerkennung (OCR) ermöglicht Softwareentwicklern das Laden, Lesen und Konvertieren von Bildern, PDFs oder gescannten Dokumenten in Text oder durchsuchbare Dokumente

Die Technologie zur optischen Zeichenerkennung (OCR) hat in den letzten Jahren bedeutende Fortschritte gemacht und erleichtert die Automatisierung der Datenextraktion aus verschiedenen Quellen. Sie ermöglicht Automatisierung, verbessert die Datenzugänglichkeit und steigert die Produktivität in verschiedenen Bereichen. Ein solches leistungsstarkes Tool ist die OcrSpace Ruby-Bibliothek, die Entwicklern eine unkomplizierte Lösung zur Integration von OCR-Funktionen in ihre Ruby-Anwendungen bietet. Diese Bibliothek vereinfacht das Extrahieren von Text aus Bildern, gescannten Dokumenten und PDF-Dateien und ist daher eine ausgezeichnete Wahl für Entwickler, die nach einer praktischen OCR-Lösung suchen.

Die OcrSpace Ruby-Bibliothek bietet eine unkomplizierte und intuitive Benutzeroberfläche, die die Integration von OCR-Funktionen in Ruby-Anwendungen erleichtert. Die Bibliothek bietet mehrere wichtige Funktionen, wie das Laden verschiedener Bildtypen, das Extrahieren von Text aus Bildern, das Konvertieren gescannter Dokumente in Text, das Extrahieren von Text aus Dokumenten, die in mehreren Sprachen verfasst sind, das Erkennen von Text aus Bildern mit niedriger Auflösung, das Arbeiten mit handschriftlichen Inhalten, das Abrufen der Koordinaten des erkannten Textes, das Erkennen von Seitenzahlen, das Identifizieren bestimmter Bereiche von Interesse und vieles mehr.

Die OcrSpace Ruby-Bibliothek ist ein Wrapper um die Ocr.Space OCR-API, die eine zuverlässige und genaue Textextraktion aus Bildern und PDF-Dokumenten bietet. Diese speziell für Ruby-Entwickler erstellte Bibliothek vereinfacht den Integrationsprozess und ermöglicht es Programmierern, OCR-Funktionen schnell in ihre Anwendungen zu integrieren, ohne sich mit den Komplexitäten der zugrunde liegenden API befassen zu müssen. Egal, ob Sie ein Dokumentenverwaltungssystem erstellen, die Datenextraktion automatisieren oder die Zugänglichkeit verbessern, die OcrSpace Ruby-Bibliothek ist ein unschätzbares Werkzeug, das den OCR-Prozess rationalisiert und Ihre Anwendungen mit genauen Textextraktionsfunktionen ausstattet.

Previous Next

Erste Schritte mit OcrSpace

Die empfohlene Methode zur Installation von OcrSpace ist die Verwendung von Rubygems. Bitte verwenden Sie den folgenden Befehl für eine reibungslose Installation.

OcrSpace über Rubygems installieren

$ gem install ocr_space 

Sie können die kompilierte gemeinsam genutzte Bibliothek vom Github-Repository herunterladen.

Bilder von URLs in Text umwandeln über die Ruby-API

Die Open-Source-Bibliothek OcrSpace enthält einige leistungsstarke Funktionen zum Laden verschiedener Bildtypen und deren Umwandlung in Text mit ein paar Zeilen Ruby-Code. Die Bibliothek unterstützt verschiedene OCR-Optionen, darunter das Extrahieren von Text aus Bildern, gescannten Dokumenten und PDF-Dateien. Ob Softwareentwickler Rechnungen, Quittungen oder andere Dokumenttypen verarbeiten müssen, die Ruby-Bibliothek OcrSpace kann dies effizient erledigen. Das folgende Beispiel zeigt, wie Softwareentwickler Bilder mithilfe der Ruby-API über URLs in Text umwandeln können.

Bilder von URLs über die Ruby-API konvertieren

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Erweiterte OCR-Funktionen über die Ruby-API

Die Open-Source-Bibliothek OcrSpace enthält einige sehr nützliche und erweiterte Funktionen für die Handhabung von OCR-Vorgängen in Ruby-Anwendungen. Sie kann Text aus Bildern mit niedriger Auflösung, verzerrtem Text und sogar handschriftlichem Inhalt genau erkennen und so in verschiedenen Szenarien zuverlässige Ergebnisse gewährleisten. Neben der Textextraktion ermöglicht die Bibliothek Entwicklern auch, andere wichtige Informationen aus Dokumenten zu extrahieren. Dazu gehören das Abrufen der Koordinaten des erkannten Textes, das Erkennen von Seitenzahlen und das Identifizieren bestimmter Bereiche von Interesse innerhalb des Dokuments.

Wie extrahiere ich Text aus einer hochgeladenen Datei über die Ruby-API?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result
 Українська