1. Produkte
  2.   OCR
  3.   Ruby
  4.   OcrSpace
 
  

Open-Source-Ruby-Bibliothek zum Online-Konvertieren von Bildern in Text

Die kostenlose Ruby-Bibliothek zur optischen Zeichenerkennung (OCR) ermöglicht Softwareentwicklern das Laden, Lesen und Konvertieren von Bildern, PDFs oder gescannten Dokumenten in Text oder durchsuchbare Dokumente

Die OCR-Technologie (Optical Character Recognition) hat in den letzten Jahren erhebliche Fortschritte gemacht und erleichtert die Automatisierung der Datenextraktion aus verschiedenen Quellen. Es ermöglicht die Automatisierung, verbessert den Datenzugriff und steigert die Produktivität in verschiedenen Bereichen. Ein solches leistungsstarkes Tool ist die OcrSpace Ruby-Bibliothek, die Entwicklern eine unkomplizierte Lösung für die Integration von OCR-Funktionen in ihre Ruby-Anwendungen bietet. Diese Bibliothek vereinfacht das Extrahieren von Text aus Bildern, gescannten Dokumenten und PDF-Dateien und ist somit eine ausgezeichnete Wahl für Entwickler, die eine praktische OCR-Lösung suchen.

Die OcrSpace Ruby-Bibliothek bietet eine unkomplizierte und intuitive Benutzeroberfläche, die die Integration von OCR-Funktionen in Ruby-Anwendungen erleichtert. Die Bibliothek verfügt über mehrere wichtige Funktionen, wie das Laden verschiedener Bildtypen, das Extrahieren von Text aus Bildern, das Konvertieren gescannter Dokumente in Text, das Extrahieren von Text aus in mehreren Sprachen verfassten Dokumenten, das Erkennen von Text aus Bildern mit niedriger Auflösung und das Arbeiten mit handschriftlichen Inhalten , Abrufen von Koordinaten des erkannten Textes, Erkennen von Seitenzahlen, Identifizieren bestimmter Interessengebiete und vieles mehr.

Die OcrSpace Ruby-Bibliothek ist ein Wrapper um die Ocr.Space OCR-API, die eine zuverlässige und genaue Textextraktion aus Bildern und PDF-Dokumenten ermöglicht. Diese speziell für Ruby-Entwickler entwickelte Bibliothek vereinfacht den Integrationsprozess und ermöglicht es Programmierern, OCR-Funktionalität schnell in ihre Anwendungen zu integrieren, ohne sich mit der Komplexität der zugrunde liegenden API auseinandersetzen zu müssen. Unabhängig davon, ob Sie ein Dokumentenverwaltungssystem aufbauen, die Datenextraktion automatisieren oder die Zugänglichkeit verbessern, ist die OcrSpace Ruby-Bibliothek ein unschätzbar wertvolles Tool, das den OCR-Prozess rationalisiert und Ihre Anwendungen mit präzisen Textextraktionsfunktionen ausstattet.

Previous Next

Erste Schritte mit OcrSpace

Die empfohlene Methode zur Installation von OcrSpace ist die Verwendung von Rubygems. Für eine reibungslose Installation verwenden Sie bitte den folgenden Befehl.

Installieren Sie OcrSpace über Rubygems

$ gem install ocr_space 

Sie können die kompilierte gemeinsam genutzte Bibliothek aus dem Github-Repository herunterladen.

Bilder über die Ruby-API von URL in Text konvertieren

Die Open-Source-Bibliothek OcrSpace enthält einige leistungsstarke Funktionen zum Laden verschiedener Bildtypen und deren Konvertierung in Text mit ein paar Zeilen Ruby-Code. Die Bibliothek unterstützt verschiedene OCR-Optionen, darunter das Extrahieren von Text aus Bildern, gescannten Dokumenten und PDF-Dateien. Ganz gleich, ob Softwareentwickler Rechnungen, Quittungen oder andere Arten von Dokumenten verarbeiten müssen, die OcrSpace Ruby-Bibliothek kann damit effizient umgehen. Das folgende Beispiel zeigt, wie Softwareentwickler mithilfe der Ruby API Bilder über eine URL in Text konvertieren können.

Bilder von URL über Ruby API konvertieren

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Erweiterte OCR-Funktionen über Ruby API

Die Open-Source-Bibliothek OcrSpace enthält einige sehr nützliche und erweiterte Funktionen für die Handhabung von OCR-Vorgängen in Ruby-Anwendungen. Es kann Text aus Bildern mit niedriger Auflösung, verzerrtem Text und sogar handgeschriebenen Inhalten genau erkennen und so zuverlässige Ergebnisse in verschiedenen Szenarien gewährleisten. Neben der Textextraktion ermöglicht die Bibliothek Entwicklern auch die Extraktion anderer wichtiger Informationen aus Dokumenten. Dazu gehört das Abrufen der Koordinaten des erkannten Textes, das Erkennen von Seitenzahlen und das Identifizieren spezifischer Interessenbereiche innerhalb des Dokuments.

Wie extrahiere ich Text aus einer hochgeladenen Datei über die Ruby-API?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result
 Deutsch