API JavaScript open source per aggiungere e gestire l'OCR nelle app Web

Una libreria JavaScript gratuita leader per aggiungere funzionalità di riconoscimento ottico dei caratteri (OCR) alle app Web JS e trasformare gratuitamente immagini di testo stampato o scritto a mano in testo leggibile dalla macchina.

Tesseract.js è una libreria JavaScript open source molto utile che consente agli sviluppatori di software di integrare la funzionalità di riconoscimento ottico dei caratteri (OCR) all'interno delle loro applicazioni web con il minimo sforzo e costo. L'OCR è il processo di conversione di immagini di testo stampato o scritto a mano in testo leggibile dalla macchina. Tesseract.js è un port del popolare motore Tesseract OCR, originariamente sviluppato da Hewlett-Packard negli anni '80 e successivamente gestito da Google. Tesseract.js è in grado di riconoscere oltre 100 lingue, rendendolo un potente strumento per gli sviluppatori che desiderano aggiungere funzionalità OCR alle proprie applicazioni web.

Tesseract.js è molto facile da gestire e può essere utilizzato per una varietà di attività, come estrarre testo da documenti scansionati, ricevute e biglietti da visita, automatizzare le attività di immissione dati e migliorare la funzionalità di ricerca all'interno delle applicazioni web. Uno dei principali vantaggi di Tesseract.js è la sua capacità di riconoscere il testo anche quando l'immagine di input è di scarsa qualità o risoluzione. La libreria utilizza algoritmi di apprendimento automatico per migliorare la precisione dei risultati OCR. Può anche eseguire analisi del layout della pagina e rilevare aree di interesse all'interno di un'immagine.

Tesseract.js sta diventando popolare grazie alla sua facilità d'uso e alle potenti funzionalità OCR e può essere eseguito senza problemi in un browser o su un server con NodeJS. Fornisce una semplice API che consente agli sviluppatori di software di configurare le opzioni OCR come lingua, modalità di segmentazione della pagina e caratteri della whitelist. La sua capacità di riconoscere il testo da immagini di scarsa qualità e il supporto per più lingue lo rendono uno strumento prezioso per un'ampia gamma di applicazioni e una scelta eccellente per gli sviluppatori che desiderano aggiungere l'OCR alle proprie applicazioni web.

In sintesi

Una panoramica delle funzionalità di Tesseract.js.

Panoramica delle funzionalità

Esegui l'OCR
Aggiungi funzionalità OCR
Riconosci il testo dell'immagine
Converti immagini di testo
Testo carattere riconosciuto
Cerca PDF
Oltre 100 lingue
Crea app OCR
Salva nel browser
Estrai testo
Supporto multithreading

Tesseract.js

Tesseract.js supporta i formati di file immagine più diffusi elencati di seguito.

Lettore

PNG, JPEG, BMP, TIFF, TGA, DICOM

Scrittore

PNG, JPEG, BMP, TIFF

Tesseract.js

Indipendenza dalla piattaforma

Tesseract.js può funzionare con qualsiasi linguaggio di programmazione basato su Java

Java

Tesseract.js

Iniziare con Tesseract.js

Il modo consigliato per installare Tesseract.js è utilizzare npm. Utilizza il seguente comando per un'installazione fluida

Installa Tesseract.jsvia npm

 npm install tesseract.js

Puoi anche installarlo manualmente; scarica i file della versione più recente direttamente dal repository GitHub.

Converti immagine in testo tramite API JavaScript

La libreria JavaScript open source Tesseract.js consente agli sviluppatori di software di lavorare facilmente con vari tipi di immagini come BMP, JPG, PNG, PBM, WebP e molte altre. La libreria supporta l'estrazione del testo dalle immagini per automatizzare l'elaborazione dei testi su immagini, PDF e documenti scansionati. L'esempio seguente mostra come caricare un'immagine ed estrarne il testo con solo un paio di righe di codice. L'argomento lingua viene utilizzato per determinare i dati linguistici addestrati da utilizzare nell'elaborazione delle immagini. Gli sviluppatori di software possono utilizzare più lingue qui.

Come convertire un'immagine in testo utilizzando l'API JavaScript?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

Leggi un'area di immagine ed estrai testo tramite API JS

La libreria JavaScript open source ha incluso funzionalità molto utili per leggere un'area particolare all'interno di un'immagine e catturarne i dati all'interno delle applicazioni JavaScript. L'API supporta l'acquisizione dell'area dell'immagine e tenta di riconoscere il testo all'interno di quest'area utilizzando il potente motore OCR interno. Gli esempi seguenti mostrano come gli sviluppatori di software possono fornire l'URL all'immagine e l'API può facilmente rilevare e riconoscere il testo nell'area selezionata.

Leggere e riconoscere il testo in un'area selezionata di un'immagine tramite l'API JS

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();