Libreria Ruby open source per convertire immagini in testo online

La libreria gratuita Ruby per il riconoscimento ottico dei caratteri (OCR) consente agli sviluppatori di software di caricare, leggere e convertire immagini, PDF o documenti scansionati in documenti di testo o ricercabili

La tecnologia di riconoscimento ottico dei caratteri (OCR) ha compiuto progressi significativi negli ultimi anni, semplificando l'automazione dell'estrazione dei dati da varie fonti. Consente l'automazione, migliora l'accessibilità ai dati e aumenta la produttività in vari domini. Uno di questi strumenti potenti è la libreria OcrSpace Ruby, che fornisce agli sviluppatori una soluzione semplice per integrare le funzionalità OCR nelle loro applicazioni Ruby. Questa libreria semplifica il processo di estrazione del testo da immagini, documenti scansionati e file PDF, rendendola una scelta eccellente per gli sviluppatori che cercano una comoda soluzione OCR.

La libreria OcrSpace Ruby offre un'interfaccia semplice e intuitiva, semplificando l'integrazione delle funzionalità OCR nelle applicazioni Ruby. Ci sono diverse funzionalità importanti che fanno parte della libreria, come caricare vari tipi di immagini, estrarre testo da immagini, convertire documenti scansionati in testo, estrarre testo da documenti scritti in più lingue, riconoscere testo da immagini a bassa risoluzione, lavorare con contenuti scritti a mano , recupero delle coordinate del testo riconosciuto, rilevamento dei numeri di pagina, identificazione di aree di interesse specifiche e molto altro.

La libreria OcrSpace Ruby è un wrapper attorno all'API Ocr.Space OCR, che offre un'estrazione di testo affidabile e accurata da immagini e documenti PDF. Creata appositamente per gli sviluppatori Ruby, questa libreria semplifica il processo di integrazione, consentendo ai programmatori di incorporare rapidamente la funzionalità OCR nelle loro applicazioni senza affrontare le complessità dell'API sottostante. Che tu stia creando un sistema di gestione dei documenti, automatizzando l'estrazione dei dati o migliorando l'accessibilità, la libreria OcrSpace Ruby è uno strumento prezioso che semplifica il processo OCR e potenzia le tue applicazioni con funzionalità di estrazione di testo accurate.

In sintesi

Una panoramica delle funzionalità di OcrSpace.

Panoramica delle funzionalità

Esegui l'OCR
Aggiungi funzionalità OCR
Riconosci il testo dell'immagine
Carica immagini tramite URL
Converti testo PDF in formato PDF
Testo carattere riconosciuto
Cerca PDF
Altre lingue
Crea app OCR
Salva nel browser
Estrai testo
Supporto multithreading

OcrSpace

OcrSpace supporta i formati di file di compressione più diffusi elencati di seguito.

Lettore

PNG, JPEG, BMP, TIFF, TGA, DICOM

Scrittore

PNG, JPEG, BMP, TIFF

OcrSpace

Indipendenza dalla piattaforma

OcrSpace richiede solo Ruby Runtime.

Ruby 5.1 e versioni successive.

OcrSpace

Iniziare con OcrSpace

Il modo consigliato per installare OcrSpace è utilizzare Rubygems. Si prega di utilizzare il seguente comando per un'installazione fluida.

Installa OcrSpace tramite Rubygems

$ gem install ocr_space

Puoi scaricare la libreria condivisa compilata dal repository Github.

Converti immagini da URL a testo tramite API Ruby

La libreria open source OcrSpace ha incluso alcune potenti funzionalità per caricare vari tipi di immagini e convertirle in testo con un paio di righe di codice Ruby. La libreria supporta varie opzioni OCR, inclusa l'estrazione di testo da immagini, documenti scansionati e file PDF. Se gli sviluppatori di software devono elaborare fatture, ricevute o qualsiasi altro tipo di documento, la libreria OcrSpace Ruby può gestirlo in modo efficiente. L'esempio seguente mostra come gli sviluppatori di software possono convertire le immagini in testo tramite URL utilizzando l'API Ruby.

Converti immagini da URL tramite API Ruby

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Funzionalità OCR avanzate tramite API Ruby

La libreria open source OcrSpace ha incluso alcune funzionalità molto utili e avanzate per la gestione delle operazioni OCR all'interno delle applicazioni Ruby. È in grado di riconoscere con precisione il testo da immagini a bassa risoluzione, testo distorto e persino contenuto scritto a mano, garantendo risultati affidabili in vari scenari. Oltre all'estrazione del testo, la libreria consente anche agli sviluppatori di estrarre altre informazioni importanti dai documenti. Ciò include il recupero delle coordinate del testo riconosciuto, il rilevamento dei numeri di pagina e l'identificazione di aree di interesse specifiche all'interno del documento.

Come estrarre il testo da un file caricato tramite l'API Ruby?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result