Open Source JavaScript API til at tilføje og administrere OCR til webapps

Et førende gratis JavaScript-bibliotek til at tilføje optisk tegngenkendelse (OCR) funktionalitet til JS Web Apps og transformere billeder af trykt eller håndskrevet tekst til maskinlæsbar tekst gratis.

Tesseract.js er et meget nyttigt open source JavaScript-bibliotek, der gør det muligt for softwareudviklere at integrere optisk tegngenkendelse (OCR) funktionalitet i deres webapplikationer med minimal indsats og omkostninger. OCR er processen med at konvertere billeder af trykt eller håndskrevet tekst til maskinlæsbar tekst. Tesseract.js er en port til den populære Tesseract OCR-motor, som oprindeligt blev udviklet af Hewlett-Packard i 1980'erne og senere vedligeholdt af Google. Tesseract.js kan genkende over 100 sprog, hvilket gør det til et kraftfuldt værktøj for udviklere, der ønsker at tilføje OCR-funktionalitet til deres webapplikationer.

Tesseract.js er meget let at håndtere og kan bruges til en række opgaver, såsom udtrækning af tekst fra scannede dokumenter, kvitteringer og visitkort, automatisering af dataindtastningsopgaver samt forbedring af søgefunktionalitet i webapplikationer. En af de vigtigste fordele ved Tesseract.js er dens evne til at genkende tekst, selv når inputbilledet er af dårlig kvalitet eller opløsning. Biblioteket bruger maskinlæringsalgoritmer til at forbedre nøjagtigheden af OCR-resultater. Det kan også udføre sidelayoutanalyse og detektere områder af interesse i et billede.

Tesseract.js bliver populær på grund af dens brugervenlighed samt kraftfulde OCR-funktioner og kan køres problemfrit enten i en browser eller på en server med NodeJS. Det giver en simpel API, der giver softwareudviklere mulighed for at konfigurere OCR-indstillinger såsom sprog, sidesegmenteringstilstand og hvidlistetegn. Dens evne til at genkende tekst fra billeder af dårlig kvalitet og understøttelse af flere sprog gør det til et værdifuldt værktøj til en lang række applikationer og et fremragende valg for udviklere, der ønsker at tilføje OCR til deres webapplikationer.

Oversigt

En oversigt over Tesseract.js-funktioner.

Oversigt over funktioner

Udfør OCR
Tilføj OCR-funktioner
Genkend billedtekst
Konverter billeder af tekst
Genkendt skrifttypetekst
Søg i PDF
Over 100 sprog
Opret OCR-apps
Gem i browser
Udtræk tekst
Multi-threading Support

Tesseract.js

Tesseract.js understøtter populære billedfilformater anført nedenfor.

Læser

PNG, JPEG, BMP, TIFF, TGA, DICOM

Forfatter

PNG, JPEG, BMP, TIFF

Tesseract.js

Platformuafhængighed

Tesseract.js kan arbejde med ethvert Java-baseret programmeringssprog

Java

Tesseract.js

Kom godt i gang med Tesseract.js

Den anbefalede måde at installere Tesseract.js på er at bruge npm. Brug venligst følgende kommando for en problemfri installation

Installer Tesseract.jsvia npm

 npm install tesseract.js

Du kan også installere det manuelt; download de seneste udgivelsesfiler direkte fra GitHub-lageret.

Konverter billede til tekst via JavaScript API

Open source JavaScript-biblioteket Tesseract.js gør det nemt for softwareudviklere at arbejde med forskellige typer billeder såsom BMP, JPG, PNG, PBM, WebP og flere. Biblioteket understøtter udtrækning af tekst fra billeder for at automatisere behandlingen af tekster på billeder, PDF'er og scannede dokumenter. Følgende eksempel viser, hvordan man indlæser et billede og uddraget tekst fra det med blot et par linjer kode. Sprogargumentet bruges til at bestemme de trænede sprogdata, der skal bruges til behandling af billeder. Softwareudviklere kan bruge flere sprog herovre.

Hvordan konverteres billede til tekst ved hjælp af JavaScript API?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

Læs en billedregion og udtræk tekst via JS API

Open source JavaScript-biblioteket har inkluderet en meget nyttig funktion til at læse et bestemt område inde i et billede og fange dets data i JavaScript-applikationer. API'et understøtter optagelse af billedområdet og forsøger at genkende tekst i denne region ved hjælp af den interne kraftfulde OCR-motor. De følgende eksempler viser, hvordan softwareudviklere kan give URL til billedet, og API'en nemt kan registrere og genkende tekst i det valgte område.

Læs og genkend tekst i et udvalgt område af et billede via JS API

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();