Gratis Node.js API til at tilføje OCR-funktioner til JS-projekter.
Open source Node.js OCR-bibliotek, der giver programmører mulighed for at genkende & udtrække tekst fra forskellige filformater, herunder billeder (JPEG, PNG), PDF'er og dokumenter gratis på flere sprog.
Hvad er Node-Tesseract-OCR?
I dagens digitale tidsalder er udtrækning af tekst fra billeder og dokumenter blevet en afgørende opgave i forskellige brancher, herunder dokumenthåndtering, databehandling og kunstig intelligens. Teknologi for optisk tegngenkendelse (OCR) har gjort det muligt at konvertere scannede dokumenter, billeder og PDF'er til redigerbare tekstformater. Node-Tesseract-OCR er et open source API, der integrerer kraften fra Tesseract OCR-motoren for at give en problemfri og effektiv måde at udføre OCR-opgaver i Node.js-applikationer på.
Node-Tesseract-OCR er en Node.js-omslag for Tesseract OCR-motoren, som giver softwareudviklere mulighed for at udnytte Tesseracts kraftfulde tekstgenkendelsesfunktioner i et Node.js-miljø. API'et vedligeholdes i dette GitHub-repositorium og tilbyder en række funktioner, der gør det egnet til forskellige anvendelsestilfælde, fra simpel tekstudtrækning til mere komplekse dokumentbehandlingsopgaver. Softwareudviklere kan udtrække tekst fra billeder og dokumenter på flere sprog, hvilket gør det til et alsidigt værktøj til forskellige applikationer.
Node-Tesseract-OCR API'et leverer avancerede billedbehandlingsfunktioner, herunder billedfiltrering, skalering og beskæring, for at sikre at den udtrukne tekst er præcis og pålidelig. Det understøtter over 100 sprog, hvilket gør det til en alsidig løsning for OCR-opgaver i forskellige miljøer. Softwareudviklere kan udtrække tekst fra billeder, PDF'er og dokumenter og returnere den udtrukne tekst i forskellige formater, såsom JSON, XML og ren tekst. Det er designet til at være letvægts, fleksibelt og nemt at bruge, hvilket gør det til et ideelt valg for udviklere, der ønsker at tilføje OCR-funktionalitet til deres projekter. Med sine avancerede billedbehandlingsfunktioner, sprogunderstøttelse og fejlhåndteringsmekanismer er det et ideelt valg for udviklere, der vil tilføje OCR-funktionalitet til deres projekter.
Kom i gang med Node-Tesseract-OCR
Den anbefalede måde at installere Node-Tesseract-OCR på er ved at bruge npm. Brug venligst følgende kommando for en problemfri installation
Install Node-Tesseract-OCR via npm
npm install node-tesseract-ocr Du kan også installere det manuelt; download de seneste udgivelsesfiler direkte fra GitHub repoet.
Tekstudtrækning fra billeder i Node.js API
Det open source Node-Tesseract-OCR-bibliotek gør det nemt for softwareudviklere at skabe applikationer, der automatisk udtrækker tekst fra billeder i Node.js-applikationer. Det understøtter tekstudtrækning fra scannede dokumenter, PDF'er, kamera-fotos eller kvitteringsbilleder. Dette kan være nyttigt til at skabe søgbare arkiver, automatisere dataindtastning eller behandle store mængder dokumenter i sektorer som finans og sundhedspleje. Her er et enkelt eksempel, der viser, hvordan man programmatisk udtrækker tekst fra billeder i Node.js-applikationer.
How to Extract Text from Images inside Node.js Environment?
const tesseract = require("node-tesseract-ocr");
tesseract.recognize("path/to/image.jpg")
.then(text => {
console.log("Recognized Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Bedre billedforbehandling i Node.js
Forbehandling af billeder før OCR kan væsentligt forbedre nøjagtigheden af tekstgenkendelse. Det open source Node-Tesseract-OCR-bibliotek tillader grundlæggende forbehandlingsteknikker, såsom skalering, binarisering og retningkorrektion. Disse forbehandlingstrin kan implementeres ved hjælp af yderligere Node.js-biblioteker som sharp eller jimp i kombination med Node-Tesseract-OCR. Følgende eksempel viser, hvordan softwareudviklere bruger forbehandlingstrin til at forbedre genkendelsen, især ved billeder af lavere kvalitet.
How to Apply Preprocessing Steps to Improve Recognition via Node.js API?
const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");
sharp("path/to/input.jpg")
.resize(800, 600) // Resize the image
.greyscale() // Convert to greyscale
.toBuffer()
.then(data => {
return tesseract.recognize(data, { lang: "eng" });
})
.then(text => {
console.log("Preprocessed Image Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Genkendt tekst på flere sprog
En af de mest fremtrædende funktioner ved Node-Tesseract-OCR er den omfattende understøttelse af flere sprog. Tesseract OCR-biblioteket understøtter over 100 sprog, hvilket gør det til et ideelt valg for applikationer, der skal behandle dokumenter på forskellige sprog. Softwareudviklere kan angive de sprog, de ønsker, at Tesseract skal bruge, hvilket forbedrer genkendelsesnøjagtigheden for ikke-engelske tekster. Her er et eksempel, der viser, hvordan softwareudviklere kan genkende tekst på fransk i Node.js-applikationer.
How to Recognized Text from Image in French via JavaScript API?
const config = {
lang: "fra", // French language support
oem: 1,
psm: 3
};
tesseract.recognize("path/to/french-text-image.jpg", config)
.then(text => {
console.log("Recognized Text in French:", text);
})
.catch(error => {
console.error("Error:", error.message);
});