Gratis JavaScript-bibliotheek om tekst te parseren van gescande afbeeldingen en formulieren

Open source Optical Character Recognition (OCR) JavaScript-bibliotheek voor het parseren van tekst uit zwart-wit gescande afbeeldingen en documenten met beeldvoorbewerking en sjabloonondersteuning in web- of Node.js‑apps.

In de moderne digitale wereld speelt optische tekenherkenning (OCR) technologie een cruciale rol bij het omzetten van gescande afbeeldingen, handgeschreven notities of gedrukte documenten naar bewerkbare en doorzoekbare gegevens. Voor JavaScript‑ontwikkelaars die op zoek zijn naar een lichte en open‑source oplossing, biedt Guten OCR een overtuigende keuze. Deze op JavaScript gebaseerde OCR‑engine is ontworpen met eenvoud in gedachten, waardoor hij ideaal is om OCR‑functies direct in browser‑gebaseerde of Node.js‑toepassingen te integreren. Er zijn verschillende belangrijke functies onderdeel van de bibliotheek, zoals karakterherkenning via sjablonen, drempelwaardebepaling en binarisatie van afbeeldingen, karaktersegmentatie, sjabloonmatching en tekstassemblage, modulair code‑basisondersteuning en meer. Hij richt zich op het herkennen van gedrukte tekst uit zwart‑wit gescande documenten en is het best geschikt voor goed opgemaakte tekst, zoals boeken of formulieren.

Guten OCR is een open‑source JavaScript OCR‑engine gemaakt door Gutenye. In tegenstelling tot zware OCR‑tools die externe afhankelijkheden of uitgebreide installatie vereisen, is Guten OCR volledig in JavaScript geschreven, wat betekent dat hij kan draaien in een webbrowser of op de server met Node.js. De bibliotheek gebruikt basis‑beeldverwerkingstechnieken om karakters te segmenteren en te identificeren met een karakterpatroon‑herkenningssysteem. Hoewel hij nog niet kan concurreren met commerciële OCR‑engines zoals Tesseract op het gebied van meertalige of handgeschreven tekstondersteuning, maken zijn eenvoud en hack‑baarheid hem tot een fantastische optie voor educatieve projecten, proof‑of‑concepts of ingebedde OCR‑functies in aangepaste web‑apps. In tegenstelling tot Tesseract of andere grotere engines is Guten OCR opzettelijk lichtgewicht en gefocust—waardoor hij een uitstekend startpunt is voor iedereen die wil begrijpen hoe OCR onder de motorkap werkt.

In één oogopslag

Een overzicht van de functies van Guten OCR.

Functies Overzicht

Afbeeldingstekst parseren
OCR toepassen op afbeeldingen
Afbeeldingstekst herkennen
Afbeeldingen van tekst converteren
Herkennde lettertype‑tekst
Beeldvoorbewerking
Sjablonen gebruiken voor OCR
OCR‑apps maken
Opslaan in de browser
Tekst extraheren
Ondersteuning voor multithreading

Guten OCR

Guten OCR ondersteunt de populaire afbeeldingsbestandsformaten die hieronder staan vermeld.

Lezer

PNG, JPEG, BMP, TIFF, TGA, DICOM

Schrijver

PNG, JPEG, BMP, TIFF

Guten OCR

Platformonafhankelijkheid

Guten OCR kan werken met elke op Java gebaseerde programmeertaal

Java-runtime

Guten OCR

Aan de slag met Guten OCR

De aanbevolen manier om Guten OCR te installeren is via Brew. Gebruik de volgende opdracht voor een soepele installatie

Installeer Guten OCR via Brew

 brew install git-lfs

Installeer Guten OCR via GitHub

 git clone git@github.com:gutenye/ocr.git

Je kunt het ook handmatig installeren; download de nieuwste release‑bestanden rechtstreeks van GitHub repository.

Beeldvoorbewerking vóór OCR-bewerkingen

De open source Guten OCR‑bibliotheek is volledig in JavaScript geschreven, waardoor hij compatibel is met zowel browser‑ als Node.js‑omgevingen. Hij bevat ingebouwde beeldvoorbewerkingsfuncties om de herkenningsnauwkeurigheid te verbeteren. Hij ondersteunt beeldbinarisatie (omzetten naar zwart‑wit), ruisreductie, scheefcorrectie en meer. Het volgende voorbeeld laat zien hoe ontwikkelaars meerdere beeldvoorbewerkingsstappen kunnen toepassen voordat ze een OCR‑bewerking op afbeeldingen uitvoeren.

Hoe beeldvoorbewerking toepassen vóór OCR‑bewerking via JavaScript‑bibliotheek?

const { preprocess } = require('guten-ocr');

// Apply multiple preprocessing steps
const processedImage = preprocess(imageData, [
  'grayscale',    // Convert to grayscale
  'binarize',     // Convert to black and white
  'deskew',       // Correct skew
  'denoise'       // Reduce noise
]);

// Then perform OCR on the processed image
ocr.recognize(processedImage).then(/* ... */);

Karakterherkenning via sjablonen

De JavaScript‑bibliotheek Guten OCR biedt volledige ondersteuning voor het uitvoeren van OCR‑bewerkingen met behulp van sjablonen binnen JavaScript‑toepassingen. Het hart van Guten OCR is een sjabloon‑matching‑systeem. In plaats van een machine‑learning‑model te trainen, gebruikt het vooraf gedefinieerde karakterpatronen. Dit maakt het systeem sneller en makkelijker te begrijpen, maar gevoeliger voor consistentie in lettertype en lay‑out. Om deze taak uit te voeren rendert de bibliotheek elk karakter (A–Z, a–z, 0–9, enz.) in een canvas en maakt vervolgens een binair matrix‑template voor elk karakter. Bij het analyseren van een afbeelding vergelijkt de bibliotheek beeldsegmenten met deze sjablonen om de beste overeenkomst te vinden. Het doet dit met een combinatie van verticale en horizontale lijn‑scans om begrenzingskaders te lokaliseren.

Karaktersegmentatie via OCR-bibliotheek

De open source JavaScript‑bibliotheek Guten OCR stelt software‑ontwikkelaars in staat om karaktersegmentatie eenvoudig uit te voeren. Zodra de afbeelding is gebinariseerd, is de volgende stap het segmenteren van individuele karakters. Guten OCR scant rijen en kolommen om gebieden met dichte zwarte pixels te detecteren, en scheidt deze in potentiële karakters. Het volgende voorbeeld toont hoe software‑ontwikkelaars karaktersegmentatie kunnen uitvoeren met behulp van de JavaScript‑OCR‑bibliotheek.

Hoe karaktersegmentatie uitvoeren met JavaScript‑bibliotheek?

const segment = require('guten-ocr/segment');
const boxes = segment(binarized); // returns array of [x, y, width, height]