1. Produkter
  2.   Ordbehandling
  3.   Node.js
  4.   DocumentVision
 
  

Node.js gratisbibliotek för att extrahera data från skannade dokument

Ledande Open Source Node.js-bibliotek för bearbetning av skannade dokument möjliggör effektiv laddning, läsning, bearbetning och extrahering av text från skannade dokument i Node.js-appar.

Vad är DocumentVision ?

I dagens digitala era är det avgörande för organisationer av alla storlekar att hantera dokument effektivt. Med den ökande volymen av dokument kan det vara en utmaning att upprätthålla deras integritet, säkerhet och tillgänglighet. Det är här DocumentVision, ett open-source-bibliotek, kommer in i bilden. DV är ett kraftfullt open source-bibliotek utformat för mjukvaruutvecklare som behöver arbeta med skannade dokument. Byggt på Node.js utnyttjar det flera robusta teknologier, inklusive Tesseract för optisk teckenigenkänning (OCR), OpenCV för bildbehandling och ZXing för streckkodsläsning. Denna kombination gör det möjligt för mjukvaruutvecklare att skapa applikationer som kan hantera dokumenthanteringsuppgifter effektivt.

DocumentVision är ett Node.js-bibliotek som erbjuder en omfattande uppsättning verktyg för att läsa och hantera skannade dokument i Node.js-applikationer. Det låter utvecklare ladda, läsa, uppdatera, radera eller extrahera text eller bilder från dokument, samt utföra avancerade operationer som sökning, filtrering och sortering med bara ett par kodrader. Biblioteket är utformat för att vara flexibelt och skalbart, vilket gör det lämpligt för ett brett spektrum av applikationer, från små dokumenthanteringssystem till stora företagslösningar. För mjukvaruutvecklare abstraherar det komplexiteten i att hantera rå dokumentdata och möjliggör skapandet av anpassade applikationer som hanterar skannade dokument, automatiserar arbetsflöden eller extraherar användbar information från bilder.

Previous Next

Kom igång med DocumentVision

För att installera DocumentVision kan du använda npm, paketchefen för JavaScript. Vänligen använd följande kommandon för en lyckad installation.

Installera DocumentVision via npm

$ npm install dv  

Installera DocumentVision via GitHub

clone https://github.com/creatale/node-dv.git

Bildladdning & manipulation via Node.js-bibliotek

Det öppna källkods-biblioteket DocumentVision gör det möjligt för mjukvaruutvecklare att utföra olika bildbehandlingsuppgifter genom sin integration med OpenCV. Det låter utvecklare förbättra bildkvaliteten, justera dimensioner eller till och med förbehandla bilden för bättre OCR-resultat. Mjukvaruutvecklare kan ladda, ändra storlek, rotera och justera bilder för att förbättra deras kvalitet innan de bearbetas. Du kan också ladda skannade dokument samt bilder och extrahera text från dem i Node.js-applikationer. Här är ett exempel som visar hur utvecklare kan ändra storlek och rotera bilder i Node.js-applikationer.

Hur man ändrar storlek och roterar bilden i Node.js-appar?

const image = new dv.Image('path/to/image.png');
// Resize and rotate the image
image.resize(800, 600).rotate(90).save('path/to/output.png')

Optisk teckenigenkänning (OCR) i Node.js

DocumentVision integrerar Tesseract-motorn, vilket gör det möjligt för användare att konvertera text från skannade dokument eller bilder till redigerbara format i Node.js-applikationer. Denna funktion är avgörande för dokumentdigitalisering och gör det möjligt för mjukvaruutvecklare att extrahera tryckt text från bildfiler som PDF:er eller skannade JPEG-filer. Följande kodexempel visar hur utvecklare kan ladda och extrahera text från PNG-bilder i en Node.js-miljö.

Hur man extraherar text från PNG-bilder i Node.js-appar?

const dv = require('node-dv');
const ocr = new dv.OCR();

ocr.recognize('path/to/image.png', (err, text) => {
    if (err) {
        console.error('OCR Error:', err);
    } else {
        console.log('Extracted Text:', text);
    }
});

Streckkoddetektering & avkodning i Node.js

Streckkodsläsning är en annan viktig funktion i det öppna källkods-biblioteket DocumentVision, möjliggjord genom integration med ZXing-streckkodsläsaren. Denna funktionalitet är användbar för att hantera dokument som innehåller streckkoder, såsom fraktetiketter, fakturor eller produktinformationsblad. Här är ett enkelt exempel som visar hur mjukvaruutvecklare kan ladda en streckkodsbild och avkoda den i Node.js-applikationer.

Hur man laddar och avkodar streckkodsbilder i Node.js-appar?

const barcode = new dv.Barcode();
barcode.decode('path/to/barcode.png', (err, result) => {
    if (err) {
        console.error('Barcode Error:', err);
    } else {
        console.log('Decoded Barcode:', result);
    }
}); 

Anpassningsbart arbetsflöde

DocumentVision erbjuder en robust och flexibel plattform för utvecklare att bygga anpassade applikationer som hanterar skannade dokument. Biblioteket möjliggör anpassning, vilket gör det möjligt för utvecklare att skräddarsy bearbetningspipeline för att möta deras specifika krav. Denna flexibilitet kan leda till mer effektiva arbetsflöden anpassade efter specifika användningsfall.

 Svenska