Nemokama Node.js API, skirta pridėti OCR galimybes JS projektams.

Atviro kodo Node.js OCR biblioteka, leidžianti programuotojams atpažinti ir išgauti tekstą iš įvairių failų formatų, įskaitant vaizdus (JPEG, PNG), PDF ir dokumentus, nemokamai keliomis kalbomis.

Kas yra Node-Tesseract-OCR?

Šiandieninėje skaitmeninėje eroje teksto išskleidimas iš vaizdų ir dokumentų tapo svarbia užduotimi įvairiose pramonės šakose, įskaitant dokumentų valdymą, duomenų apdorojimą ir dirbtinį intelektą. Optinio simbolių atpažinimo (OCR) technologija leido konvertuoti nuskenuotus dokumentus, vaizdus ir PDF į redaguojamus teksto formatus. Node-Tesseract-OCR yra atviro kodo API, kuri įtraukia Tesseract OCR variklio galią, suteikdama sklandų ir efektyvų būdą atlikti OCR užduotis Node.js programose.

Node-Tesseract-OCR yra Node.js apvalkalas Tesseract OCR varikliui, leidžiantis programinės įrangos kūrėjams naudoti Tesseract galingas teksto atpažinimo funkcijas Node.js aplinkoje. API prižiūrima šioje GitHub saugykloje ir siūlo daugybę funkcionalumų, kurie ją padaro tinkamą įvairiems naudojimo atvejams – nuo paprasto teksto išskleidimo iki sudėtingesnių dokumentų apdorojimo užduočių. Programinės įrangos kūrėjai gali išgauti tekstą iš vaizdų ir dokumentų keliomis kalbomis, todėl tai yra universalus įrankis įvairioms programoms.

Node-Tesseract-OCR API suteikia pažangias vaizdo apdorojimo galimybes, įskaitant filtravimą, dydžio keitimą ir apkirpimą, siekiant užtikrinti, kad išgautas tekstas būtų tikslus ir patikimas. Ji palaiko daugiau nei 100 kalbų, todėl yra universalus sprendimas OCR užduotims įvairiose aplinkose. Programinės įrangos kūrėjai gali išgauti tekstą iš vaizdų, PDF ir dokumentų, ir grąžinti išgautą tekstą įvairiais formatais, tokiais kaip JSON, XML ir paprastas tekstas. Ji sukurta būti lengva, lanksti ir paprasta naudoti, todėl yra idealus pasirinkimas kūrėjams, norintiems pridėti OCR galimybes į savo projektus. Su pažangiomis vaizdo apdorojimo galimybėmis, kalbų palaikymu ir klaidų tvarkymo mechanizmais, tai yra idealus pasirinkimas kūrėjams, norintiems pridėti OCR galimybes į savo projektus.

Apžvalga

Node-Tesseract-OCR funkcijų apžvalga.

Funkcijų apžvalga

Vykdyti OCR
Pridėti OCR galimybes
Atpažinti vaizdo tekstą
Konvertuoti teksto vaizdus
Atpažintas šrifto tekstas
Ieškoti PDF
Daugiau nei 100 kalbų
Kurti OCR programėles
Išsaugoti naršyklėje
Išgauti tekstą
Daugiagijė palaikymas

Node-Tesseract-OCR

Node-Tesseract-OCR palaiko populiarius vaizdo failų formatus, išvardintus žemiau.

Skaitytojas

PNG, JPEG, BMP, TIFF, TGA, DICOM

Rašytojas

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

Platformos nepriklausomumas

Node-Tesseract-OCR gali veikti su bet kuria Java pagrindu sukurta programavimo kalba

Java

Node-Tesseract-OCR

Pradžia su Node-Tesseract-OCR

Rekomenduojamas būdas įdiegti Node-Tesseract-OCR yra naudojant npm. Prašome naudoti šią komandą sklandžiam diegimui

Įdiegti Node-Tesseract-OCR per npm

npm install node-tesseract-ocr

Taip pat galite įdiegti rankiniu būdu; atsisiųskite naujausius leidimo failus tiesiai iš GitHub saugyklos.

Teksto išskleidimas iš vaizdų Node.js API

Atviro kodo Node-Tesseract-OCR biblioteka palengvina programinės įrangos kūrėjams kurti programas, kurios automatiškai išskleidžia tekstą iš vaizdų Node.js programose. Ji palaiko teksto išskleidimą iš nuskenuotų dokumentų, PDF, fotoaparato nuotraukų ar kvitų nuotraukų. Tai gali būti naudinga kuriant peržiūrimus archyvus, automatizuojant duomenų įvedimą arba apdorojant didelius dokumentų kiekius sektoriuose, tokiuose kaip finansai ir sveikatos priežiūra. Čia pateiktas paprastas pavyzdys, rodantis, kaip programiškai išskleisti tekstą iš vaizdų Node.js programose.

Kaip išskleisti tekstą iš vaizdų Node.js aplinkoje?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Geresnis vaizdo išankstinis apdorojimas Node.js

Vaizdų išankstinis apdorojimas prieš taikant OCR gali žymiai pagerinti teksto atpažinimo tikslumą. Atviro kodo Node-Tesseract-OCR biblioteka leidžia naudoti pagrindines išankstinio apdorojimo technikas, tokias kaip dydžio keitimas, binarizavimas ir iškreipimo korekcija. Šiuos išankstinio apdorojimo žingsnius galima įgyvendinti naudojant papildomas Node.js bibliotekas, tokias kaip sharp arba jimp, kartu su Node-Tesseract-OCR. Žemiau pateiktas pavyzdys rodo, kaip programinės įrangos kūrėjai naudoja išankstinio apdorojimo žingsnius, kad pagerintų atpažinimą, ypač su prastesnės kokybės vaizdais.

Kaip taikyti išankstinio apdorojimo žingsnius, siekiant pagerinti atpažinimą per Node.js API?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Atpažintas tekstas keliomis kalbomis

Viena iš išskirtinių Node-Tesseract-OCR savybių yra platus daugiakalbis palaikymas. Tesseract OCR biblioteka palaiko daugiau nei 100 kalbų, todėl tai yra idealus pasirinkimas programoms, kurioms reikia apdoroti dokumentus įvairiomis kalbomis. Programinės įrangos kūrėjai gali nurodyti kalbą (-as), kurią nori, kad Tesseract naudotų, taip pagerindami atpažinimo tikslumą neanglų tekstams. Čia pateiktas pavyzdys, rodantis, kaip programinės įrangos kūrėjai gali atpažinti tekstą prancūzų kalba Node.js programose?

Kaip atpažinti tekstą iš vaizdo prancūzų kalba per JavaScript API?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });