Open Source JavaScript API pentru a adăuga și a gestiona OCR în aplicațiile web

O bibliotecă JavaScript gratuită de top pentru adăugarea funcționalității de recunoaștere optică a caracterelor (OCR) la JS Web Apps și transformarea gratuită a imaginilor de text tipărit sau scris de mână în text care poate fi citit de mașină.

Tesseract.js este o bibliotecă JavaScript open-source foarte utilă, care permite dezvoltatorilor de software să integreze funcționalitatea de recunoaștere optică a caracterelor (OCR) în aplicațiile lor web cu efort și cost minim. OCR este procesul de conversie a imaginilor de text tipărit sau scris de mână în text care poate fi citit de mașină. Tesseract.js este un port al popularului motor Tesseract OCR, care a fost dezvoltat inițial de Hewlett-Packard în anii 1980 și mai târziu întreținut de Google. Tesseract.js poate recunoaște peste 100 de limbi, ceea ce îl face un instrument puternic pentru dezvoltatorii care doresc să adauge funcționalitate OCR aplicațiilor lor web.

Tesseract.js este foarte ușor de manevrat și poate fi utilizat pentru o varietate de sarcini, cum ar fi extragerea textului din documente scanate, chitanțe și cărți de vizită, automatizarea sarcinilor de introducere a datelor, precum și îmbunătățirea funcționalității de căutare în cadrul aplicațiilor web. Unul dintre avantajele cheie ale Tesseract.js este capacitatea sa de a recunoaște textul chiar și atunci când imaginea de intrare este de calitate sau rezoluție proastă. Biblioteca folosește algoritmi de învățare automată pentru a îmbunătăți acuratețea rezultatelor OCR. De asemenea, poate efectua o analiză a aspectului paginii și poate detecta regiunile de interes din cadrul unei imagini.

Tesseract.js devine popular datorită ușurinței sale de utilizare, precum și capabilităților OCR puternice și poate fi rulat fără probleme fie într-un browser, fie pe un server cu NodeJS. Oferă un API simplu care permite dezvoltatorilor de software să configureze opțiunile OCR, cum ar fi limba, modul de segmentare a paginii și caracterele din lista albă. Capacitatea sa de a recunoaște textul din imagini de calitate slabă și suportul pentru mai multe limbi îl fac un instrument valoros pentru o gamă largă de aplicații și o alegere excelentă pentru dezvoltatorii care doresc să adauge OCR aplicațiilor lor web.

Într-o privire

O prezentare generală a funcțiilor Tesseract.js.

Prezentare generală a caracteristicilor

Efectuați OCR
Adăugați capabilități OCR
Recunoașteți textul imaginii
Conduceți imagini de text
Text font recunoscut
Căutați PDF
Peste 100 de limbi
Creați aplicații OCR
Salvați în browser
Extrageți text
Suport multi-threading

Tesseract.js

Tesseract.js acceptă formatele populare de fișiere imagine enumerate mai jos.

Cititor

PNG, JPEG, BMP, TIFF, TGA, DICOM

Scriitor

PNG, JPEG, BMP, TIFF

Tesseract.js

Independența platformei

Tesseract.js poate funcționa cu orice limbaj de programare bazat pe Java

Java

Tesseract.js

Noțiuni introductive cu Tesseract.js

Modul recomandat de a instala Tesseract.js este utilizarea npm. Vă rugăm să utilizați următoarea comandă pentru o instalare fără probleme

Instalați Tesseract.jsvia npm

 npm install tesseract.js

De asemenea, îl puteți instala manual; descărcați cele mai recente fișiere de lansare direct din depozitul GitHub.

Convertiți imaginea în text prin API-ul JavaScript

Biblioteca JavaScript open source Tesseract.js facilitează pentru dezvoltatorii de software să lucreze cu diferite tipuri de imagini, cum ar fi BMP, JPG, PNG, PBM, WebP și multe altele. Biblioteca acceptă extragerea textului din imagini pentru a automatiza procesarea textelor pe imagini, PDF-uri și documente scanate. Următorul exemplu arată cum să încărcați o imagine și să extrageți text din ea cu doar câteva rânduri de cod. Argumentul limbajului este utilizat pentru a determina datele limbajului antrenat care vor fi utilizate în procesarea imaginilor. Dezvoltatorii de software pot folosi mai multe limbi aici.

Cum se convertesc imaginea în text folosind API-ul JavaScript?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

Citiți o regiune de imagine și extrageți text prin API-ul JS

Biblioteca JavaScript open source a inclus o caracteristică foarte utilă pentru citirea unei anumite zone din interiorul unei imagini și capturarea datelor acesteia în aplicațiile JavaScript. API-ul acceptă capturarea zonei imaginii și încearcă să recunoască textul din această regiune folosind motorul OCR intern puternic. Următoarele exemple arată cum dezvoltatorii de software pot furniza URL-ul imaginii, iar API-ul poate detecta și recunoaște cu ușurință textul din zona selectată.

Citiți și recunoașteți textul într-o regiune selectată a unei imagini prin API-ul JS

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();