Libreria Ruby avanzata gratuita per caricare ed estrarre testo dalle immagini

Un'API OCR Ruby open source leader e un convertitore da immagine a testo che consente agli sviluppatori di software di caricare, riconoscere ed estrarre testo da immagini (immagini scansionate e file PDF)

Il riconoscimento ottico dei caratteri (OCR) è una potente tecnologia che consente ai computer di riconoscere ed estrarre testo da immagini o documenti scansionati. Ha numerose applicazioni, che vanno dalla digitalizzazione di materiali stampati all'automazione dei processi di immissione dei dati. Nel linguaggio di programmazione Ruby, una libreria popolare per l'OCR è Ruby-Tesseract-OCR. Ruby-Tesseract-OCR è una gemma di rubino che funge da involucro per il motore Tesseract OCR. Tesseract è un motore OCR open source sviluppato da Google ed è rinomato per la sua precisione e il supporto linguistico.

Ruby-Tesseract-OCR va oltre le funzionalità OCR di base e offre funzionalità aggiuntive per casi d'uso avanzati. Ad esempio, gli sviluppatori di software possono specificare una regione di interesse (ROI) all'interno di un'immagine per limitare l'analisi OCR a un'area specifica. Ciò è particolarmente utile quando si ha a che fare con documenti complessi o quando è necessario estrarre solo il testo da una sezione specifica. La libreria fornisce diverse funzionalità aggiuntive per migliorare le capacità OCR, come il caricamento di un'immagine esistente, l'estrazione di testo da immagini o documenti scansionati, l'ottenimento di output HOCR (HTML OCR) e molto altro.

Il gem Ruby-Tesseract-OCR fornisce un'interfaccia facile da usare per interagire con il motore Tesseract, consentendo agli sviluppatori Ruby di integrare facilmente le funzionalità OCR nei loro progetti. Che tu abbia bisogno di estrarre informazioni dalle fatture, digitalizzare materiali stampati o automatizzare le attività di immissione dati, la libreria open source fornisce una soluzione affidabile ed efficiente. Provalo e sblocca oggi stesso il potenziale dell'OCR nei tuoi progetti Ruby.

In sintesi

Una panoramica delle funzionalità di Ruby-Tesseract-OCR.

Panoramica delle funzionalità

Esegui l'OCR
Aggiungi funzionalità OCR
Riconosci il testo dell'immagine
Carica immagini tramite URL
Converti testo PDF in formato PDF
Testo carattere riconosciuto
Cerca PDF
Altre lingue
Crea app OCR
Salva nel browser
Estrai testo
Supporto multithreading

Ruby-Tesseract-OCR

Ruby-Tesseract-OCR supporta i formati di file OCR più diffusi elencati di seguito.

Lettore

PNG, JPEG, BMP, TIFF, TGA, DICOM

Scrittore

PNG, JPEG, BMP, TIFF

Ruby-Tesseract-OCR

Indipendenza dalla piattaforma

Ruby-Tesseract-OCR richiede solo Ruby Runtime.

Ruby 5.1 e versioni successive.

Ruby-Tesseract-OCR

Iniziare con Ruby-Tesseract-OCR

Il modo consigliato per installare Ruby-Tesseract-OCR è utilizzare Rubygems. Si prega di utilizzare il seguente comando per un'installazione fluida.

Installa Ruby-Tesseract-OCR tramite Rubygems

gem install tesseract-ocr

Puoi scaricare la libreria condivisa compilata dal repository Github.

Estrai testo da immagini e documenti scansionati tramite Ruby

Ruby-Tesseract-OCR è una libreria open source molto potente che consente agli sviluppatori di software di caricare ed estrarre testo da vari tipi di immagini con solo un paio di righe di codice Ruby. La libreria semplifica l'estrazione del testo da immagini, PDF o documenti scansionati. Il flusso di lavoro tipico prevede il caricamento di un'immagine, la configurazione dei parametri OCR e il richiamo del motore OCR per riconoscere il testo. Per un'operazione di successo gli sviluppatori devono fornire il percorso dell'immagine che desiderano elaborare e chiamare il metodo text_for per estrarre il testo. Infine, il risultato verrà stampato sulla console. La libreria offre varie opzioni di configurazione F per controllare il comportamento dell'OCR, come la modalità di segmentazione della pagina, i caratteri della whitelist e altro. Gli esempi seguenti mostrano come gli sviluppatori di software possono caricare un'immagine JPEG ed estrarne il testo all'interno delle applicazioni Ruby.

Come estrarre testo dalle immagini utilizzando i comandi Ruby?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

Estrai testo da una particolare area di immagine tramite Ruby

La libreria open source Ruby-Tesseract-OCR va oltre le funzionalità OCR di base e offre funzionalità aggiuntive per casi d'uso avanzati. Ad esempio, gli utenti possono specificare una regione di interesse (ROI) all'interno di un'immagine per limitare l'analisi OCR a un'area specifica. Ciò è particolarmente utile quando si ha a che fare con documenti complessi o quando gli utenti devono solo estrarre il testo da una sezione specifica. Inoltre, la libreria fornisce metodi per ottenere output HOCR (HTML OCR), che include non solo il testo riconosciuto ma anche informazioni sul layout e sulle coordinate degli elementi di testo. L'output HOCR è utile quando sono necessari dati più granulari o si desidera eseguire ulteriori analisi sulla struttura del testo.

Come eseguire hOCR su un'immagine tramite Ruby Library?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')