Bibliothèque Ruby Open Source pour convertir des images en texte en ligne

La bibliothèque gratuite de reconnaissance optique de caractères (OCR) Ruby permet aux développeurs de logiciels de charger, lire et convertir des images, des PDF ou des documents numérisés en texte ou en documents consultables.

La technologie de reconnaissance optique de caractères (OCR) a réalisé des progrès significatifs ces dernières années, facilitant ainsi l'automatisation de l'extraction de données à partir de diverses sources. Il permet l'automatisation, améliore l'accessibilité des données et améliore la productivité dans divers domaines. L'un de ces outils puissants est la bibliothèque OcrSpace Ruby, qui offre aux développeurs une solution simple pour intégrer les fonctionnalités OCR dans leurs applications Ruby. Cette bibliothèque simplifie le processus d'extraction de texte à partir d'images, de documents numérisés et de fichiers PDF, ce qui en fait un excellent choix pour les développeurs à la recherche d'une solution OCR pratique.

La bibliothèque OcrSpace Ruby offre une interface simple et intuitive, facilitant l'intégration des fonctionnalités OCR dans les applications Ruby. La bibliothèque comporte plusieurs fonctionnalités importantes, telles que le chargement de différents types d'images, l'extraction de texte à partir d'images, la conversion de documents numérisés en texte, l'extraction de texte à partir de documents écrits dans plusieurs langues, la reconnaissance de texte à partir d'images basse résolution, l'utilisation de contenu manuscrit. , récupérer les coordonnées du texte reconnu, détecter les numéros de page, identifier les domaines d'intérêt spécifiques et bien d'autres encore.

La bibliothèque OcrSpace Ruby est un wrapper autour de l'API Ocr.Space OCR, qui permet une extraction de texte fiable et précise à partir d'images et de documents PDF. Conçue spécifiquement pour les développeurs Ruby, cette bibliothèque simplifie le processus d'intégration, permettant aux programmeurs d'incorporer rapidement la fonctionnalité OCR dans leurs applications sans avoir à gérer les complexités de l'API sous-jacente. Que vous construisiez un système de gestion de documents, automatisiez l'extraction de données ou amélioriez l'accessibilité, la bibliothèque OcrSpace Ruby est un outil inestimable qui rationalise le processus OCR et donne à vos applications des capacités d'extraction de texte précises.

En un coup d'œil

Un aperçu des fonctionnalités d'OcrSpace.

Présentation des fonctionnalités

Effectuer l'OCR
Ajouter des fonctionnalités OCR
Reconnaître le texte de l'image
Charger des images via une URL
Convertir le texte PDF en tp
Texte de police reconnu
Rechercher un PDF
Autres langues
Créer des applications OCR
Enregistrer dans le navigateur
Extraire le texte
Support multithread

OcrSpace

OcrSpace prend en charge les formats de fichiers de compression populaires répertoriés ci-dessous.

Lecteur

PNG, JPEG, BMP, TIFF, TGA, DICOM

Écrivain

PNG, JPEG, BMP, TIFF

OcrSpace

Indépendance de la plateforme

OcrSpace nécessite uniquement Ruby Runtime.

Ruby 5.1 et versions ultérieures.

OcrSpace

Premiers pas avec OcrSpace

La méthode recommandée pour installer OcrSpace consiste à utiliser Rubygems. Veuillez utiliser la commande suivante pour une installation fluide.

Installer OcrSpace via Rubygems

$ gem install ocr_space

Vous pouvez télécharger la bibliothèque partagée compilée à partir du référentiel Github.

Convertir des images d'URL en texte via l'API Ruby

La bibliothèque open source OcrSpace inclut des fonctionnalités puissantes permettant de charger différents types d'images et de les convertir en texte avec quelques lignes de code Ruby. La bibliothèque prend en charge diverses options OCR, notamment l'extraction de texte à partir d'images, de documents numérisés et de fichiers PDF. Que les développeurs de logiciels aient besoin de traiter des factures, des reçus ou tout autre type de document, la bibliothèque OcrSpace Ruby peut le gérer efficacement. L'exemple suivant montre comment les développeurs de logiciels peuvent convertir des images en texte via une URL à l'aide de l'API Ruby.

Convertir des images à partir d'une URL via l'API Ruby

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Capacités OCR avancées via l'API Ruby

La bibliothèque open source OcrSpace inclut des fonctionnalités très utiles et avancées pour gérer les opérations OCR dans les applications Ruby. Il peut reconnaître avec précision le texte des images basse résolution, du texte déformé et même du contenu manuscrit, garantissant ainsi des résultats fiables dans divers scénarios. Outre l'extraction de texte, la bibliothèque permet également aux développeurs d'extraire d'autres informations importantes à partir de documents. Cela inclut la récupération des coordonnées du texte reconnu, la détection des numéros de page et l'identification des zones d'intérêt spécifiques dans le document.

Comment extraire le texte d'un fichier téléchargé via l'API Ruby ?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result