API JavaScript open source per aggiungere e gestire l'OCR nelle app Web
Una libreria JavaScript gratuita leader per aggiungere funzionalità di riconoscimento ottico dei caratteri (OCR) alle app Web JS e trasformare gratuitamente immagini di testo stampato o scritto a mano in testo leggibile dalla macchina.
Tesseract.js è una libreria JavaScript open source molto utile che consente agli sviluppatori di software di integrare la funzionalità di riconoscimento ottico dei caratteri (OCR) all'interno delle loro applicazioni web con il minimo sforzo e costo. L'OCR è il processo di conversione di immagini di testo stampato o scritto a mano in testo leggibile dalla macchina. Tesseract.js è un port del popolare motore Tesseract OCR, originariamente sviluppato da Hewlett-Packard negli anni '80 e successivamente gestito da Google. Tesseract.js è in grado di riconoscere oltre 100 lingue, rendendolo un potente strumento per gli sviluppatori che desiderano aggiungere funzionalità OCR alle proprie applicazioni web.
Tesseract.js è molto facile da gestire e può essere utilizzato per una varietà di attività, come estrarre testo da documenti scansionati, ricevute e biglietti da visita, automatizzare le attività di immissione dati e migliorare la funzionalità di ricerca all'interno delle applicazioni web. Uno dei principali vantaggi di Tesseract.js è la sua capacità di riconoscere il testo anche quando l'immagine di input è di scarsa qualità o risoluzione. La libreria utilizza algoritmi di apprendimento automatico per migliorare la precisione dei risultati OCR. Può anche eseguire analisi del layout della pagina e rilevare aree di interesse all'interno di un'immagine.
Tesseract.js sta diventando popolare grazie alla sua facilità d'uso e alle potenti funzionalità OCR e può essere eseguito senza problemi in un browser o su un server con NodeJS. Fornisce una semplice API che consente agli sviluppatori di software di configurare le opzioni OCR come lingua, modalità di segmentazione della pagina e caratteri della whitelist. La sua capacità di riconoscere il testo da immagini di scarsa qualità e il supporto per più lingue lo rendono uno strumento prezioso per un'ampia gamma di applicazioni e una scelta eccellente per gli sviluppatori che desiderano aggiungere l'OCR alle proprie applicazioni web.
Iniziare con Tesseract.js
Il modo consigliato per installare Tesseract.js è utilizzare npm. Utilizza il seguente comando per un'installazione fluida
Installa Tesseract.jsvia npm
npm install tesseract.js
Puoi anche installarlo manualmente; scarica i file della versione più recente direttamente dal repository GitHub.
Converti immagine in testo tramite API JavaScript
La libreria JavaScript open source Tesseract.js consente agli sviluppatori di software di lavorare facilmente con vari tipi di immagini come BMP, JPG, PNG, PBM, WebP e molte altre. La libreria supporta l'estrazione del testo dalle immagini per automatizzare l'elaborazione dei testi su immagini, PDF e documenti scansionati. L'esempio seguente mostra come caricare un'immagine ed estrarne il testo con solo un paio di righe di codice. L'argomento lingua viene utilizzato per determinare i dati linguistici addestrati da utilizzare nell'elaborazione delle immagini. Gli sviluppatori di software possono utilizzare più lingue qui.
Come convertire un'immagine in testo utilizzando l'API JavaScript?
Tesseract.recognize(
image,language,
{
logger: m => console.log(m)
}
)
.catch (err => {
console.error(err);
})
.then(result => {
console.log(result);
})
}
Leggi un'area di immagine ed estrai testo tramite API JS
La libreria JavaScript open source ha incluso funzionalità molto utili per leggere un'area particolare all'interno di un'immagine e catturarne i dati all'interno delle applicazioni JavaScript. L'API supporta l'acquisizione dell'area dell'immagine e tenta di riconoscere il testo all'interno di quest'area utilizzando il potente motore OCR interno. Gli esempi seguenti mostrano come gli sviluppatori di software possono fornire l'URL all'immagine e l'API può facilmente rilevare e riconoscere il testo nell'area selezionata.
Leggere e riconoscere il testo in un'area selezionata di un'immagine tramite l'API JS
const { createWorker } = require('tesseract.js');
const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };
(async () => {
await worker.loadLanguage('eng');
await worker.initialize('eng');
const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
console.log(text);
await worker.terminate();
})();