1. Produktai
  2.   OCR
  3.   JavaScript
  4.   Tesseract.js
 
  

Atvirojo kodo „JavaScript“ API, skirta pridėti ir valdyti OCR prie žiniatinklio programų

Pirmaujanti nemokama „JavaScript“ biblioteka, skirta JS žiniatinklio programoms pridėti optinio simbolių atpažinimo (OCR) funkciją ir nemokamai paversti spausdinto arba ranka rašyto teksto vaizdus į mašininiu būdu skaitomą tekstą.

Tesseract.js yra labai naudinga atvirojo kodo „JavaScript“ biblioteka, leidžianti programinės įrangos kūrėjams integruoti optinio simbolių atpažinimo (OCR) funkciją į savo žiniatinklio programas su minimaliomis pastangomis ir sąnaudomis. OCR yra spausdinto arba ranka parašyto teksto vaizdų konvertavimo į mašininio skaitomo teksto procesas. Tesseract.js yra populiaraus Tesseract OCR variklio, kurį devintajame dešimtmetyje iš pradžių sukūrė Hewlett-Packard, o vėliau prižiūrėjo Google, prievadas. Tesseract.js gali atpažinti daugiau nei 100 kalbų, todėl tai yra galingas įrankis kūrėjams, norintiems prie savo žiniatinklio programų pridėti OCR funkcijų.

Tesseract.js yra labai lengva tvarkyti ir gali būti naudojamas atliekant įvairias užduotis, pvz., išgauti tekstą iš nuskaitytų dokumentų, kvitų ir vizitinių kortelių, automatizuoti duomenų įvedimo užduotis, taip pat pagerinti paieškos funkcionalumą žiniatinklio programose. Vienas iš pagrindinių Tesseract.js privalumų yra galimybė atpažinti tekstą net tada, kai įvesties vaizdas yra prastos kokybės ar raiškos. Biblioteka naudoja mašininio mokymosi algoritmus, kad pagerintų OCR rezultatų tikslumą. Jis taip pat gali atlikti puslapio išdėstymo analizę ir aptikti dominančias sritis vaizde.

Tesseract.js populiarėja dėl paprasto naudojimo ir galingų OCR galimybių, todėl jį galima sklandžiai paleisti naršyklėje arba serveryje su NodeJS. Tai suteikia paprastą API, leidžiančią programinės įrangos kūrėjams konfigūruoti OCR parinktis, pvz., kalbą, puslapio segmentavimo režimą ir baltojo sąrašo simbolius. Dėl gebėjimo atpažinti tekstą iš prastos kokybės vaizdų ir palaikymą keliomis kalbomis jis yra vertingas įrankis įvairioms programoms ir puikus pasirinkimas kūrėjams, norintiems pridėti OCR prie savo žiniatinklio programų.

Previous Next

Darbo su Tesseract.js pradžia

Rekomenduojamas būdas įdiegti Tesseract.js yra naudoti npm. Norėdami sklandžiai įdiegti, naudokite šią komandą

Įdiegti Tesseract.jsvia npm

 npm install tesseract.js

Taip pat galite įdiegti rankiniu būdu; atsisiųskite naujausius leidimo failus tiesiai iš GitHub saugyklos.

Konvertuokite vaizdą į tekstą naudodami „JavaScript“ API

Atvirojo kodo JavaScript biblioteka Tesseract.js leidžia programinės įrangos kūrėjams lengvai dirbti su įvairių tipų vaizdais, pvz., BMP, JPG, PNG, PBM, WebP ir kt. Biblioteka palaiko teksto ištraukimą iš vaizdų, kad būtų automatizuotas vaizdų, PDF ir nuskaitytų dokumentų tekstų apdorojimas. Šiame pavyzdyje parodyta, kaip įkelti vaizdą ir iš jo ištrauktą tekstą naudojant tik kelias kodo eilutes. Kalbos argumentas naudojamas norint nustatyti mokomos kalbos duomenis, kurie bus naudojami apdorojant vaizdus. Programinės įrangos kūrėjai čia gali naudoti kelias kalbas.

Kaip konvertuoti vaizdą į tekstą naudojant JavaScript API?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

Skaitykite vaizdo sritį ir ištraukite tekstą naudodami JS API

Atvirojo kodo „JavaScript“ bibliotekoje yra labai naudingų funkcijų, leidžiančių nuskaityti tam tikrą vaizdo sritį ir užfiksuoti jos duomenis „JavaScript“ programose. API palaiko vaizdo srities fiksavimą ir bando atpažinti tekstą šioje srityje, naudodama vidinį galingą OCR variklį. Šie pavyzdžiai parodo, kaip programinės įrangos kūrėjai gali pateikti vaizdo URL adresą, o API gali lengvai aptikti ir atpažinti tekstą pasirinktoje srityje.

Skaityti ir atpažinti tekstą pasirinktame vaizdo regione per JS API

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();
 Lietuvių