Bezmaksas Node.js API, lai pievienotu OCR iespējas JS projektiem.
Atvērtā koda Node.js OCR bibliotēka, kas ļauj programmētājiem atpazīt & izgūt tekstu no dažādiem failu formātiem, tostarp attēliem (JPEG, PNG), PDF un dokumentiem, bez maksas daudzvalodīgā režīmā.
Kas ir Node-Tesseract-OCR?
Mūsdienu digitālajā laikmetā teksta izgūšana no attēliem un dokumentiem ir kļuvusi par būtisku uzdevumu daudzās nozarēs, tostarp dokumentu pārvaldībā, datu apstrādē un mākslīgajā intelektā. Optiskās rakstzīmju atpazīšanas (OCR) tehnoloģija ļauj pārvērst skenētus dokumentus, attēlus un PDF rediģējamos teksta formātos. Node-Tesseract-OCR ir atvērtā koda API, kas apvieno Tesseract OCR dzinēja jaudu, lai nodrošinātu vienkāršu un efektīvu veidu OCR uzdevumu izpildei Node.js lietojumprogrammās.
Node-Tesseract-OCR ir Node.js ietvars Tesseract OCR dzinējam, kas ļauj programmatūras izstrādātājiem izmantot Tesseract spēcīgās teksta atpazīšanas iespējas Node.js vidē. API tiek uzturēts šajā GitHub krātuvē un piedāvā plašu funkcionalitāti, kas padara to piemērotu dažādiem lietojumiem – no vienkāršas teksta izgūšanas līdz sarežģītākiem dokumentu apstrādes uzdevumiem. Programmatūras izstrādātāji var izgūt tekstu no attēliem un dokumentiem vairākās valodās, padarot to par daudzpusīgu rīku dažādām lietojumprogrammām.
Node-Tesseract-OCR API nodrošina uzlabotas attēlu apstrādes iespējas, tostarp attēlu filtrēšanu, izmēru mainīšanu un apgriešanu, lai nodrošinātu, ka izgūtais teksts ir precīzs un uzticams. Tas atbalsta vairāk nekā 100 valodas, padarot to par daudzpusīgu risinājumu OCR uzdevumiem dažādās vidēs. Programmatūras izstrādātāji var izgūt tekstu no attēliem, PDF un dokumentiem, un atgriezt izgūto tekstu dažādos formātos, piemēram, JSON, XML un vienkāršā tekstā. Tas ir izstrādāts kā viegls, elastīgs un vienkārši lietojams, kas padara to par ideālu izvēli izstrādātājiem, kuri vēlas pievienot OCR iespējas saviem projektiem. Ar savām uzlabotajām attēlu apstrādes iespējām, valodu atbalstu un kļūdu apstrādes mehānismiem tas ir ideāls risinājums izstrādātājiem, kuri vēlas pievienot OCR iespējas saviem projektiem.
Sākšana ar Node-Tesseract-OCR
Ieteicamais veids, kā instalēt Node-Tesseract-OCR, ir izmantot npm. Lūdzu, izmantojiet šādu komandu, lai instalācija noritētu gludi
Instalēt Node-Tesseract-OCR, izmantojot npm
npm install node-tesseract-ocr Jūs varat arī instalēt to manuāli; lejupielādējiet jaunākos izlaiduma failus tieši no GitHub krātuves.
Teksta izgūšana no attēliem Node.js API
Atvērtā koda Node-Tesseract-OCR bibliotēka ļauj programmatūras izstrādātājiem izveidot lietojumprogrammas, kas automātiski izgūst tekstu no attēliem Node.js lietojumprogrammās. Tā atbalsta teksta izgūšanu no skenētiem dokumentiem, PDF, kameras fotoattēliem vai kvītņu fotoattēliem. Tas var būt noderīgi, lai izveidotu meklējamas arhīvus, automatizētu datu ievadi vai apstrādātu lielus dokumentu apjomus tādās nozarēs kā finanšu un veselības aprūpe. Zemāk ir vienkāršs piemērs, kas parāda, kā programmatiski izgūt tekstu no attēliem Node.js lietojumprogrammās.
Kā izgūt tekstu no attēliem Node.js vidē?
const tesseract = require("node-tesseract-ocr");
tesseract.recognize("path/to/image.jpg")
.then(text => {
console.log("Recognized Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Labāka attēlu priekšapstrāde Node.js vidē
Attēlu priekšapstrāde pirms OCR piemērošanas var būtiski uzlabot teksta atpazīšanas precizitāti. Atvērtā koda Node-Tesseract-OCR bibliotēka ļauj izmantot pamata priekšapstrādes tehnikas, piemēram, izmēru mainīšanu, binarizāciju un slīpuma korekciju. Šīs priekšapstrādes darbības var īstenot, izmantojot papildu Node.js bibliotēkas, piemēram, sharp vai jimp, kopā ar Node-Tesseract-OCR. Zemāk redzams piemērs, kā izstrādātāji izmanto priekšapstrādes soļus, lai uzlabotu atpazīšanu, īpaši ar zemākas kvalitātes attēliem.
Kā piemērot priekšapstrādes soļus, lai uzlabotu atpazīšanu, izmantojot Node.js API?
const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");
sharp("path/to/input.jpg")
.resize(800, 600) // Resize the image
.greyscale() // Convert to greyscale
.toBuffer()
.then(data => {
return tesseract.recognize(data, { lang: "eng" });
})
.then(text => {
console.log("Preprocessed Image Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Atpazīts teksts daudzvalodīgi
Viena no izcilākajām Node-Tesseract-OCR funkcijām ir plašais daudzvalodu atbalsts. Tesseract OCR bibliotēka atbalsta vairāk nekā 100 valodas, padarot to par ideālu izvēli lietojumprogrammām, kas jāapstrādā dokumenti dažādās valodās. Programmatūras izstrādātāji var norādīt valodu(-as), ko vēlas, lai Tesseract izmantotu, uzlabojot atpazīšanas precizitāti neangļu tekstiem. Zemāk ir piemērs, kā izstrādātāji var atpazīt tekstu franču valodā Node.js lietojumprogrammās?
Kā atpazīt tekstu no attēla franču valodā, izmantojot JavaScript API?
const config = {
lang: "fra", // French language support
oem: 1,
psm: 3
};
tesseract.recognize("path/to/french-text-image.jpg", config)
.then(text => {
console.log("Recognized Text in French:", text);
})
.catch(error => {
console.error("Error:", error.message);
});