Nemokama Node.js biblioteka duomenų išgaudimui iš nuskaitytų dokumentų
Lyderinė atviro kodo Node.js biblioteka nuskaitytų dokumentų apdorojimui leidžia efektyviai įkelti, skaityti, apdoroti ir išgauti tekstą iš nuskaitytų dokumentų Node.js programose.
Kas yra DocumentVision?
Šiuolaikiniame skaitmeniniame amžiuje efektyvus dokumentų valdymas yra esminis visų dydžių organizacijoms. Didėjant dokumentų apimčiai, išlaikyti jų vientisumą, saugumą ir prieinamumą gali būti sudėtinga. Šioje vietoje įsitraukia DocumentVision – atviro kodo biblioteka. DV yra galinga atviro kodo biblioteka, sukurta programinės įrangos kūrėjams, kuriems reikia dirbti su nuskaitytais dokumentais. Sukurta ant Node.js, ji naudoja kelias patikimas technologijas, įskaitant Tesseract optiniam simbolių atpažinimui (OCR), OpenCV vaizdų apdorojimui ir ZXing brūkšninio kodo skaitymui. Šis derinys leidžia programų kūrėjams kurti programėles, kurios efektyviai tvarko dokumentų valdymo užduotis.
DocumentVision yra Node.js biblioteka, teikianti išsamų įrankių rinkinį nuskaitytų dokumentų skaitymui ir valdymui Node.js programose. Ji leidžia kūrėjams įkelti, skaityti, atnaujinti, ištrinti arba išgauti tekstą ar paveikslėlius iš dokumentų, taip pat atlikti pažangias operacijas, tokias kaip paieška, filtravimas ir rūšiavimas, naudojant vos kelias kodo eilutes. Biblioteka sukurta lanksti ir mastelio keitinė, todėl tinka įvairioms programoms – nuo mažų dokumentų valdymo sistemų iki didelių įmoninių sprendimų. Programinės įrangos kūrėjams ji supaprastina žaliųjų dokumentų duomenų valdymą ir leidžia kurti pasirinktines programėles, kurios apdoroja nuskaitytus dokumentus, automatizuoja darbo procesus arba išgauna naudingą informaciją iš paveikslėlių.
Pradžia su DocumentVision
Norėdami įdiegti DocumentVision, galite naudoti npm – JavaScript paketų tvarkytuvą. Prašome naudoti šias komandas sėkmingam įdiegimui.
Įdiekite DocumentVision per npm
$ npm install dv Įdiekite DocumentVision per GitHub
clone https://github.com/creatale/node-dv.gitPaveikslėlių įkėlimas ir manipuliavimas naudojant Node.js biblioteką
Atviro kodo DocumentVision biblioteka leidžia programinės įrangos kūrėjams atlikti įvairias vaizdų apdorojimo užduotis per integraciją su OpenCV. Ji leidžia pagerinti vaizdo kokybę, keisti matmenis arba net iš anksto paruošti vaizdą geresniems OCR rezultatams. Kūrėjai gali įkelti, keisti dydį, pasukti ir reguliuoti vaizdus, siekdami pagerinti jų kokybę prieš apdorojant. Taip pat galite įkelti nuskaitytus dokumentus ir paveikslėlius bei išgauti tekstą iš jų Node.js programose. Žemiau pateiktas pavyzdys rodo, kaip kūrėjai gali keisti dydį ir pasukti vaizdus Node.js programose.
Kaip keisti dydį ir pasukti paveikslėlį Node.js programose?
const image = new dv.Image('path/to/image.png');
// Resize and rotate the image
image.resize(800, 600).rotate(90).save('path/to/output.png')
Optinis simbolių atpažinimas (OCR) Node.js
DocumentVision integruoja Tesseract variklį, leidžiantį vartotojams konvertuoti tekstą iš nuskaitytų dokumentų ar vaizdų į redaguojamus formatus Node.js programose. Ši funkcija yra būtina dokumentų skaitmenizavimui, leidžianti programinės įrangos kūrėjams išgauti atspausdintą tekstą iš vaizdo failų, pvz., PDF ar nuskaitytų JPEG. Žemiau pateiktas kodo pavyzdys rodo, kaip kūrėjai gali įkelti ir išgauti tekstą iš PNG paveikslėlių Node.js aplinkoje.
Kaip išgauti tekstą iš PNG paveikslėlių Node.js programose?
const dv = require('node-dv');
const ocr = new dv.OCR();
ocr.recognize('path/to/image.png', (err, text) => {
if (err) {
console.error('OCR Error:', err);
} else {
console.log('Extracted Text:', text);
}
});
Brūkšninio kodo aptikimas ir dekodavimas Node.js
Brūkšninio kodo skaitymas yra dar viena esminė atviro kodo DocumentVision bibliotekos funkcija, įgyvendinta integruojant ZXing brūkšninio kodo skaitytuvą. Ši funkcija naudinga valdant dokumentus, kurie turi brūkšninius kodus, pvz., siuntimo etiketes, sąskaitas faktūras arba produktų informacijos lapus. Žemiau pateiktas paprastas pavyzdys rodo, kaip programinės įrangos kūrėjai gali įkelti brūkšninio kodo paveikslėlį ir jį dekoduoti Node.js programose.
Kaip įkelti ir dekoduoti brūkšninio kodo paveikslėlius Node.js programose?
const barcode = new dv.Barcode();
barcode.decode('path/to/barcode.png', (err, result) => {
if (err) {
console.error('Barcode Error:', err);
} else {
console.log('Decoded Barcode:', result);
}
});
Pritaikomas darbo procesas
DocumentVision siūlo patikimą ir lankstų platformą kūrėjams kurti pritaikytas programas, susijusias su nuskaitytais dokumentais. Biblioteka leidžia pritaikyti, suteikdama kūrėjams galimybę pritaikyti apdorojimo procesą jų specifiniams reikalavimams. Šis lankstumas gali lemti efektyvesnius darbo procesus, pritaikytus konkretiems atvejams.