1. Producten
  2.   OCR
  3.   JavaScript
  4.   Tesseract.js
 
  

Open Source JavaScript API om OCR aan webapps toe te voegen en te beheren

Een toonaangevende gratis JavaScript-bibliotheek voor het toevoegen van Optical Character Recognition (OCR)-functionaliteit aan JS Web Apps en het gratis transformeren van afbeeldingen van gedrukte of handgeschreven tekst in machinaal leesbare tekst.

Tesseract.js is een zeer nuttige open-source JavaScript-bibliotheek waarmee softwareontwikkelaars met minimale inspanning en kosten de functionaliteit van optische tekenherkenning (OCR) in hun webapplicaties kunnen integreren. OCR is het proces waarbij afbeeldingen van gedrukte of handgeschreven tekst worden omgezet in machinaal leesbare tekst. Tesseract.js is een port van de populaire Tesseract OCR-engine, die oorspronkelijk in de jaren tachtig door Hewlett-Packard werd ontwikkeld en later werd onderhouden door Google. Tesseract.js kan meer dan 100 talen herkennen, waardoor het een krachtig hulpmiddel is voor ontwikkelaars die OCR-functionaliteit aan hun webapplicaties willen toevoegen.

Tesseract.js is heel gemakkelijk te gebruiken en kan voor een verscheidenheid aan taken worden gebruikt, zoals het extraheren van tekst uit gescande documenten, ontvangstbewijzen en visitekaartjes, het automatiseren van gegevensinvoertaken en het verbeteren van de zoekfunctionaliteit binnen webapplicaties. Een van de belangrijkste voordelen van Tesseract.js is het vermogen om tekst te herkennen, zelfs als de invoerafbeelding van slechte kwaliteit of resolutie is. De bibliotheek maakt gebruik van machine learning-algoritmen om de nauwkeurigheid van OCR-resultaten te verbeteren. Het kan ook analyses van de pagina-indeling uitvoeren en interessante gebieden binnen een afbeelding detecteren.

Tesseract.js wordt populair vanwege het gebruiksgemak en de krachtige OCR-mogelijkheden en kan soepel worden uitgevoerd in een browser of op een server met NodeJS. Het biedt een eenvoudige API waarmee softwareontwikkelaars OCR-opties kunnen configureren, zoals taal, paginasegmentatiemodus en tekens op de witte lijst. De mogelijkheid om tekst te herkennen van afbeeldingen van slechte kwaliteit en de ondersteuning voor meerdere talen maken het een waardevol hulpmiddel voor een breed scala aan toepassingen en een uitstekende keuze voor ontwikkelaars die OCR aan hun webtoepassingen willen toevoegen.

Previous Next

Aan de slag met Tesseract.js

De aanbevolen manier om Tesseract.js te installeren is met behulp van npm. Gebruik het volgende commando voor een vlotte installatie

Installeer Tesseract.jsvia npm

 npm install tesseract.js

Je kunt het ook handmatig installeren; download de nieuwste releasebestanden rechtstreeks vanuit de GitHub repository.

Afbeelding naar tekst converteren via JavaScript API

De open source JavaScript-bibliotheek Tesseract.js maakt het voor softwareontwikkelaars gemakkelijk om met verschillende soorten afbeeldingen te werken, zoals BMP, JPG, PNG, PBM, WebP en nog veel meer. De bibliotheek ondersteunt het extraheren van tekst uit afbeeldingen om de verwerking van teksten op afbeeldingen, PDF's en gescande documenten te automatiseren. Het volgende voorbeeld laat zien hoe u een afbeelding laadt en er tekst uit haalt met slechts een paar regels code. Het taalargument wordt gebruikt om de getrainde taalgegevens te bepalen die moeten worden gebruikt bij de verwerking van afbeeldingen. Softwareontwikkelaars kunnen hier meerdere talen gebruiken.

Hoe kan ik een afbeelding naar tekst converteren met behulp van de JavaScript-API?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

Een afbeeldingsregio lezen en tekst extraheren via JS API

De open source JavaScript-bibliotheek bevat zeer nuttige functies voor het lezen van een bepaald gebied in een afbeelding en het vastleggen van de gegevens ervan in JavaScript-toepassingen. De API ondersteunt het vastleggen van het afbeeldingsgebied en probeert tekst binnen dit gebied te herkennen met behulp van de interne krachtige OCR-engine. De volgende voorbeelden laten zien hoe softwareontwikkelaars een URL naar de afbeelding kunnen geven en hoe de API eenvoudig tekst in het geselecteerde gebied kan detecteren en herkennen.

Tekst in een geselecteerd gebied van een afbeelding lezen en herkennen via JS API

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();
 Dutch