Avoimen lähdekoodin JavaScript-sovellusliittymä verkkosovellusten OCR:n lisäämiseen ja hallintaan

Johtava ilmainen JavaScript-kirjasto optisen merkintunnistustoiminnon (OCR) lisäämiseen JS-verkkosovelluksiin ja painetun tai käsinkirjoitetun tekstin kuvien muuntamiseksi koneellisesti luettavaksi tekstiksi ilmaiseksi.

Tesseract.js on erittäin hyödyllinen avoimen lähdekoodin JavaScript-kirjasto, jonka avulla ohjelmistokehittäjät voivat integroida optisen merkintunnistustoiminnon (OCR) verkkosovelluksiinsa mahdollisimman vaivattomasti ja kustannuksin. OCR on prosessi, jossa painetun tai käsinkirjoitetun tekstin kuvat muunnetaan koneellisesti luettavaksi tekstiksi. Tesseract.js on portti suositulle Tesseract OCR -moottorille, jonka alun perin kehitti Hewlett-Packard 1980-luvulla ja jota myöhemmin ylläpisi Google. Tesseract.js tunnistaa yli 100 kieltä, mikä tekee siitä tehokkaan työkalun kehittäjille, jotka haluavat lisätä OCR-toimintoja verkkosovelluksiinsa.

Tesseract.js on erittäin helppo käsitellä, ja sitä voidaan käyttää monenlaisiin tehtäviin, kuten tekstin poimimiseen skannatuista asiakirjoista, kuiteista ja käyntikorteista, tietojen syöttötehtävien automatisoimiseen sekä verkkosovellusten hakutoimintojen parantamiseen. Yksi Tesseract.js:n tärkeimmistä eduista on sen kyky tunnistaa tekstiä, vaikka syötetyn kuvan laatu tai resoluutio on huono. Kirjasto käyttää koneoppimisalgoritmeja parantaakseen OCR-tulosten tarkkuutta. Se voi myös suorittaa sivun asetteluanalyysin ja havaita kiinnostavat alueet kuvassa.

Tesseract.js on tulossa suosituksi sen helppokäyttöisyyden ja tehokkaiden OCR-ominaisuuksien ansiosta, ja sitä voidaan ajaa sujuvasti joko selaimessa tai palvelimella NodeJS:n avulla. Se tarjoaa yksinkertaisen sovellusliittymän, jonka avulla ohjelmistokehittäjät voivat määrittää OCR-asetukset, kuten kielen, sivun segmentointitilan ja sallittujen luettelon merkit. Sen kyky tunnistaa tekstiä huonolaatuisista kuvista ja tuki useille kielille tekevät siitä arvokkaan työkalun monenlaisiin sovelluksiin ja erinomaisen valinnan kehittäjille, jotka haluavat lisätä tekstintunnistusta verkkosovelluksiinsa.

Yhdellä silmäyksellä

Yleiskatsaus Tesseract.js:n ominaisuuksiin.

Ominaisuuksien yleiskatsaus

Suorita OCR
Lisää OCR-ominaisuudet
Tunnista kuvan teksti
Tekstikuvat
Tunnettu kirjasinteksti
Hae PDF-tiedostosta
Yli 100 kieltä
Luo OCR-sovelluksia
Tallenna selaimeen
Poimi teksti
Monisäikeen tuki

Tesseract.js

Tesseract.js tukee alla lueteltuja suosittuja kuvatiedostomuotoja.

Lukija

PNG, JPEG, BMP, TIFF, TGA, DICOM

Kirjailija

PNG, JPEG, BMP, TIFF

Tesseract.js

Alusta riippumattomuus

Tesseract.js voi toimia minkä tahansa Java-pohjaisen ohjelmointikielen kanssa

Java

Tesseract.js

Tesseract.js:n käytön aloittaminen

Suositeltava tapa asentaa Tesseract.js on npm:n käyttö. Käytä seuraavaa komentoa sujuvaan asennukseen

Asenna Tesseract.jsvia npm

 npm install tesseract.js

Voit asentaa sen myös manuaalisesti. lataa uusimmat julkaisutiedostot suoraan GitHub-arkistosta.

Muunna kuva tekstiksi JavaScript-sovellusliittymän avulla

Avoimen lähdekoodin JavaScript-kirjasto Tesseract.js helpottaa ohjelmistokehittäjien työskentelyä erityyppisten kuvien, kuten BMP, JPG, PNG, PBM, WebP ja muiden kuvien kanssa. Kirjasto tukee tekstin purkamista kuvista kuvien, PDF-tiedostojen ja skannattujen asiakirjojen tekstien käsittelyn automatisoimiseksi. Seuraava esimerkki näyttää kuinka ladata kuva ja poimittu teksti siitä vain parilla koodirivillä. Kieliargumenttia käytetään kuvien käsittelyssä käytettävän koulutetun kielidatan määrittämiseen. Ohjelmistokehittäjät voivat käyttää täällä useita kieliä.

Kuinka muuntaa kuvan tekstiksi JavaScript API:n avulla?

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

Lue kuva-alue ja pura tekstiä JS-sovellusliittymän kautta

Avoimen lähdekoodin JavaScript-kirjastossa on erittäin hyödyllisiä ominaisuuksia, joilla voit lukea tietyn kuvan alueen ja tallentaa sen tiedot JavaScript-sovelluksiin. API tukee kuva-alueen kaappaamista ja yrittää tunnistaa tämän alueen sisällä olevan tekstin sisäisen tehokkaan OCR-moottorin avulla. Seuraavat esimerkit osoittavat, kuinka ohjelmistokehittäjät voivat tarjota kuvan URL-osoitteen ja API voi helposti havaita ja tunnistaa tekstin valitulla alueella.

Lue ja tunnista tekstiä kuvan valitulla alueella JS-sovellusliittymän kautta

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();