Gratis Node.js API for å legge til OCR-funksjoner i JS-prosjekter.

Åpen kildekode Node.js OCR-bibliotek som lar programmerere gjenkjenne og trekke ut tekst fra ulike filformater, inkludert bilder (JPEG, PNG), PDF-er og dokumenter, gratis på flere språk.

Hva er Node-Tesseract-OCR?

I dagens digitale tidsalder har uttrekk av tekst fra bilder og dokumenter blitt en viktig oppgave i ulike bransjer, inkludert dokumenthåndtering, databehandling og kunstig intelligens. Teknologi for optisk tegngjenkjenning (OCR) har gjort det mulig å konvertere skannede dokumenter, bilder og PDF-er til redigerbare tekstformater. Node-Tesseract-OCR er et åpen kildekode API som integrerer kraften til Tesseract OCR-motoren for å tilby en sømløs og effektiv måte å utføre OCR-oppgaver i Node.js-applikasjoner.

Node-Tesseract-OCR er en Node.js-omslag for Tesseract OCR-motoren, som gjør det mulig for programvareutviklere å bruke Tesseracts kraftige tekstgjenkjenningsfunksjoner i et Node.js-miljø. API-et vedlikeholdes i dette GitHub‑depotet og tilbyr en rekke funksjoner som gjør det egnet for ulike bruksområder, fra enkel tekstuttrekk til mer komplekse dokumentbehandlingsoppgaver. Programvareutviklere kan trekke ut tekst fra bilder og dokumenter på flere språk, noe som gjør det til et allsidig verktøy for ulike applikasjoner.

Node-Tesseract-OCR API-et gir avanserte bildebehandlingsfunksjoner, inkludert bildfiltrering, endring av størrelse og beskjæring, for å sikre at den uttatte teksten er nøyaktig og pålitelig. Det støtter over 100 språk, noe som gjør det til en allsidig løsning for OCR-oppgaver i ulike miljøer. Programvareutviklere kan trekke ut tekst fra bilder, PDF-er og dokumenter, og returnere den uttatte teksten i ulike formater, som JSON, XML og ren tekst. Det er designet for å være lettvektig, fleksibelt og enkelt å bruke, og er derfor et ideelt valg for utviklere som ønsker å legge til OCR-funksjoner i prosjektene sine. Med sine avanserte bildebehandlingsmuligheter, språkstøtte og feilhåndteringsmekanismer er det et ideelt valg for utviklere som vil legge til OCR-funksjoner i sine prosjekter.

På et øyeblikk

En oversikt over Node-Tesseract-OCR-funksjonene.

Features Overview

Utfør OCR
Legg til OCR-funksjoner
Gjenkjenn bildetekst
Konverter tekstbilder
Gjenkjent skrifttype-tekst
Søk i PDF
Over 100 språk
Lag OCR-apper
Lagre til nettleser
Uttrekk tekst
Støtte for flertråding

Node-Tesseract-OCR

Node-Tesseract-OCR støtter populære bildefilformater som er oppført nedenfor.

Leser

PNG, JPEG, BMP, TIFF, TGA, DICOM

Skriver

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

Plattformuavhengighet

Node-Tesseract-OCR kan fungere med ethvert Java-basert programmeringsspråk

Java

Node-Tesseract-OCR

Kom i gang med Node-Tesseract-OCR

Den anbefalte måten å installere Node-Tesseract-OCR på er ved å bruke npm. Vennligst bruk følgende kommando for en smidig installasjon

Install Node-Tesseract-OCR via npm

npm install node-tesseract-ocr

Du kan også installere det manuelt; last ned de nyeste utgivelsesfilene direkte fra GitHub-depotet.

Tekstuttrekk fra bilder i Node.js API

Det åpne kildekode-biblioteket Node-Tesseract-OCR gjør det enkelt for programvareutviklere å lage applikasjoner som automatisk trekker ut tekst fra bilder i Node.js-applikasjoner. Det støtter tekstuttrekk fra skannede dokumenter, PDF-er, kamerabilder eller kvitteringsbilder. Dette kan være nyttig for å lage søkbare arkiver, automatisere datainnsamling eller behandle store mengder dokumenter i sektorer som finans og helsevesen. Her er et enkelt eksempel som viser hvordan man programmatisk kan trekke ut tekst fra bilder i Node.js-applikasjoner.

How to Extract Text from Images inside Node.js Environment?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Bedre bildeforbehandling i Node.js

Forbehandling av bilder før OCR kan betydelig forbedre nøyaktigheten av tekstgjenkjenning. Det åpne kildekode-biblioteket Node-Tesseract-OCR tillater grunnleggende forbehandlingsteknikker, som endring av størrelse, binarisering og retting av skjevhet. Disse forbehandlingsstegene kan implementeres ved hjelp av ekstra Node.js-biblioteker som sharp eller jimp i kombinasjon med Node-Tesseract-OCR. Følgende eksempel viser hvordan programvareutviklere bruker forbehandlingssteg for å forbedre gjenkjenning, spesielt med bilder av lavere kvalitet.

How to Apply Preprocessing Steps to Improve Recognition via Node.js API?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Gjenkjent tekst på flere språk

En av de mest fremtredende funksjonene i Node-Tesseract-OCR er den omfattende støtten for flere språk. Tesseract OCR-biblioteket støtter over 100 språk, noe som gjør det til et ideelt valg for applikasjoner som må behandle dokumenter på ulike språk. Programvareutviklere kan angi hvilke språk de vil at Tesseract skal bruke, noe som forbedrer gjenkjenningsnøyaktigheten for ikke‑engelske tekster. Her er et eksempel som viser hvordan programvareutviklere kan gjenkjenne tekst på fransk i Node.js-applikasjoner.

How to Recognized Text from Image in French via JavaScript API?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });