Gratis Node.js API för att lägga till OCR-funktioner i JS-projekt.

Öppen källkod Node.js OCR-bibliotek som låter programmerare känna igen och extrahera text från olika filformat, inklusive bilder (JPEG, PNG), PDF-filer och dokument gratis på flera språk.

Vad är Node-Tesseract-OCR?

I dagens digitala era har extrahering av text från bilder och dokument blivit en avgörande uppgift i olika branscher, inklusive dokumenthantering, databehandling och artificiell intelligens. Tekniken för optisk teckenigenkänning (OCR) har gjort det möjligt att konvertera skannade dokument, bilder och PDF-filer till redigerbara textformat. Node-Tesseract-OCR är ett öppet källkods‑API som integrerar kraften i Tesseract OCR-motorn för att erbjuda ett sömlöst och effektivt sätt att utföra OCR‑uppgifter i Node.js‑applikationer.

Node-Tesseract-OCR är ett Node.js‑omslag för Tesseract OCR-motorn, vilket gör det möjligt för mjukvaruutvecklare att utnyttja Tesseracts kraftfulla textigenkänningsfunktioner i en Node.js‑miljö. API‑et underhålls i detta GitHub‑arkiv och erbjuder ett brett utbud av funktioner som gör det lämpligt för olika användningsområden, från enkel textutdragning till mer komplexa dokumentbehandlingsuppgifter. Mjukvaruutvecklare kan extrahera text från bilder och dokument på flera språk, vilket gör verktyget mångsidigt för olika tillämpningar.

Node-Tesseract-OCR‑API‑et tillhandahåller avancerade bildbehandlingsfunktioner, inklusive bildfiltrering, storleksändring och beskärning, för att säkerställa att den extraherade texten är exakt och pålitlig. Det stödjer över 100 språk, vilket gör det till en flexibel lösning för OCR‑uppgifter i olika miljöer. Mjukvaruutvecklare kan extrahera text från bilder, PDF-filer och dokument och returnera den i olika format, såsom JSON, XML och vanlig text. Det är designat för att vara lättviktigt, flexibelt och enkelt att använda, vilket gör det till ett idealiskt val för utvecklare som vill lägga till OCR‑funktioner i sina projekt. Med sina avancerade bildbehandlingsmöjligheter, språkstöd och felhanteringsmekanismer är det ett utmärkt val för utvecklare som vill integrera OCR i sina applikationer.

Översikt

En översikt av Node-Tesseract-OCR:s funktioner.

Funktionsöversikt

Utför OCR
Lägg till OCR-funktioner
Känn igen bildtext
Konvertera bilder av text
Känd teckensnittstext
Sök PDF
Över 100 språk
Skapa OCR-appar
Spara till webbläsare
Extrahera text
Stöd för flertrådad körning

Node-Tesseract-OCR

Node-Tesseract-OCR stöder populära bildfilformat som listas nedan.

Läsare

PNG, JPEG, BMP, TIFF, TGA, DICOM

Skrivare

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

Plattformsoberoende

Node-Tesseract-OCR kan fungera med alla Java‑baserade programmeringsspråk

Java

Node-Tesseract-OCR

Komma igång med Node-Tesseract-OCR

Det rekommenderade sättet att installera Node-Tesseract-OCR är att använda npm. Använd följande kommando för en smidig installation

Installera Node-Tesseract-OCR via npm

npm install node-tesseract-ocr

Du kan också installera det manuellt; ladda ner de senaste release‑filerna direkt från GitHub repository.

Textutdrag från bilder i Node.js API

Det öppna källkods‑biblioteket Node-Tesseract-OCR gör det enkelt för mjukvaruutvecklare att skapa applikationer som automatiskt extraherar text från bilder i Node.js‑applikationer. Det stödjer textutdragning från skannade dokument, PDF-filer, kamerabilder eller kvittobilder. Detta kan vara användbart för att skapa sökbara arkiv, automatisera datainmatning eller bearbeta stora mängder dokument inom sektorer som finans och sjukvård. Här är ett enkelt exempel som visar hur man programatiskt extraherar text från bilder i Node.js‑applikationer.

Hur extraherar man text från bilder i Node.js-miljö?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Bättre bildförbehandling i Node.js

Förbehandling av bilder innan OCR kan avsevärt förbättra noggrannheten i textigenkänning. Det öppna källkods‑biblioteket Node-Tesseract-OCR möjliggör grundläggande förbehandlingstekniker, såsom storleksändring, binarisering och lutningskorrigering. Dessa steg kan implementeras med ytterligare Node.js‑bibliotek som sharp eller jimp i kombination med Node-Tesseract-OCR. Följande exempel visar hur mjukvaruutvecklare använder förbehandlingssteg för att förbättra igenkänning, särskilt med bilder av lägre kvalitet.

Hur tillämpar man förbehandlingssteg för att förbättra igenkänning via Node.js API?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Känd text på flera språk

En av de mest framstående funktionerna i Node-Tesseract-OCR är dess omfattande stöd för flera språk. Tesseract OCR‑biblioteket stödjer över 100 språk, vilket gör det till ett idealiskt val för applikationer som behöver bearbeta dokument på olika språk. Mjukvaruutvecklare kan specificera vilka språk de vill att Tesseract ska använda, vilket förbättrar igenkänningsnoggrannheten för icke‑engelska texter. Här är ett exempel som visar hur mjukvaruutvecklare kan känna igen text på franska i Node.js‑applikationer?

Hur känner man igen text från bild på franska via JavaScript API?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });