Ilmainen Node.js API OCR-ominaisuuksien lisäämiseksi JS-projekteihin.

Avoimen lähdekoodin Node.js OCR -kirjasto, joka mahdollistaa ohjelmoijille tekstin tunnistamisen ja poimimisen eri tiedostomuodoista, mukaan lukien kuvat (JPEG, PNG), PDF:t ja asiakirjat, ilmaiseksi monilla kielillä.

Mikä on Node-Tesseract-OCR?

Nykyisessä digitaalisessa aikakaudessa tekstin poiminta kuvista ja asiakirjoista on tullut keskeiseksi tehtäväksi eri toimialoilla, kuten asiakirjahallinnassa, tietojenkäsittelyssä ja tekoälyssä. Optisen merkkien tunnistuksen (OCR) teknologia on mahdollistanut skannattujen asiakirjojen, kuvien ja PDF-tiedostojen muuntamisen muokattaviksi tekstimuodoiksi. Node-Tesseract-OCR on avoimen lähdekoodin API, joka hyödyntää Tesseract OCR -moottorin voimaa tarjoten saumattoman ja tehokkaan tavan suorittaa OCR-tehtäviä Node.js-sovelluksissa.

Node-Tesseract-OCR on Node.js‑kääre Tesseract OCR -moottorille, jonka avulla ohjelmistokehittäjät voivat käyttää Tesseractin tehokkaita tekstintunnistusominaisuuksia Node.js‑ympäristössä. API on ylläpidetty tässä GitHub‑repoissa ja tarjoaa laajan valikoiman toimintoja, jotka tekevät siitä sopivan erilaisiin käyttötapauksiin, yksinkertaisesta tekstin poiminnasta monimutkaisempiin asiakirjankäsittelytehtäviin. Ohjelmistokehittäjät voivat poimia tekstiä kuvista ja asiakirjoista useilla kielillä, mikä tekee siitä monikäyttöisen työkalun erilaisiin sovelluksiin.

Node-Tesseract-OCR API tarjoaa kehittyneitä kuvankäsittelyominaisuuksia, kuten kuvasuodatusta, koon muuttamista ja rajauksen, jotta poimittu teksti on tarkkaa ja luotettavaa. Se tukee yli 100 kieltä, mikä tekee siitä monipuolisen ratkaisun OCR-tehtäviin erilaisissa ympäristöissä. Ohjelmistokehittäjät voivat poimia tekstiä kuvista, PDF‑tiedostoista ja asiakirjoista, ja palauttaa poimitun tekstin eri formaateissa, kuten JSON, XML ja tavallisena tekstinä. Se on suunniteltu kevyeksi, joustavaksi ja helppokäyttöiseksi, mikä tekee siitä ihanteellisen valinnan kehittäjille, jotka haluavat lisätä OCR-ominaisuuksia projekteihinsa. Kehittyneiden kuvankäsittelyominaisuuksien, kielituen ja virheenkäsittelyn ansiosta se on erinomainen valinta kehittäjille, jotka haluavat lisätä OCR-ominaisuuksia projekteihinsa.

Katsaus

Yleiskatsaus Node-Tesseract-OCR:n ominaisuuksiin.

Ominaisuuksien yleiskatsaus

Suorita OCR
Lisää OCR-ominaisuuksia
Tunnista kuvan teksti
Muunna tekstiä sisältäviä kuvia
Tunnistettu fonttiteksti
Hae PDF:stä
Yli 100 kieltä
Luo OCR-sovelluksia
Tallenna selaimeen
Poimi teksti
Monisäikeinen tuki

Node-Tesseract-OCR

Node-Tesseract-OCR tukee alla lueteltuja suosittuja kuvatiedostomuotoja.

Lukija

PNG, JPEG, BMP, TIFF, TGA, DICOM

Kirjoittaja

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

Alustan riippumattomuus

Node-Tesseract-OCR voi toimia minkä tahansa Java-pohjaisen ohjelmointikielen kanssa

Java

Node-Tesseract-OCR

Aloittaminen Node-Tesseract-OCR:n kanssa

Suositeltu tapa asentaa Node-Tesseract-OCR on npm:n käyttö. Käytä seuraavaa komentoa sujuvaan asennukseen

Asenna Node-Tesseract-OCR npm:n kautta

npm install node-tesseract-ocr

Voit myös asentaa sen manuaalisesti; lataa uusimmat julkaisutiedostot suoraan GitHub -repositorystä.

Tekstin poiminta kuvista Node.js API:ssa

Avoimen lähdekoodin Node-Tesseract-OCR -kirjasto tekee ohjelmistokehittäjille helppoa luoda sovelluksia, jotka automaattisesti poimivat tekstiä kuvista Node.js‑sovelluksissa. Se tukee tekstin poimintaa skannatuista asiakirjoista, PDF‑tiedostoista, kamerakuvista tai kuitteja kuvaavista valokuvista. Tämä voi olla hyödyllistä haettavien arkistojen luomisessa, tietojen syöttämisen automatisoinnissa tai suurten asiakirjamäärien käsittelyssä esimerkiksi rahoitus- ja terveydenhuoltosektoreilla. Alla on yksinkertainen esimerkki, joka näyttää, miten tekstiä voidaan poimia ohjelmallisesti kuvista Node.js‑sovelluksissa.

Kuinka poimia tekstiä kuvista Node.js-ympäristössä?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Parempi kuvien esikäsittely Node.js:ssa

Kuvien esikäsittely ennen OCR:n soveltamista voi merkittävästi parantaa tekstintunnistuksen tarkkuutta. Avoimen lähdekoodin Node-Tesseract-OCR -kirjasto mahdollistaa perus-esikäsittelytekniikat, kuten koon muuttamisen, binarisoinnin ja vinouden korjaamisen. Nämä esikäsittelyvaiheet voidaan toteuttaa lisäkirjastoilla, kuten sharp tai jimp, yhdessä Node-Tesseract-OCR:n kanssa. Seuraava esimerkki näyttää, miten ohjelmistokehittäjät käyttävät esikäsittelyvaiheita tunnistuksen parantamiseksi, erityisesti heikkolaatuisissa kuvissa.

Kuinka soveltaa esikäsittelyvaiheita tunnistuksen parantamiseksi Node.js API:n kautta?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Tunnistettu teksti monilla kielillä

Yksi Node-Tesseract-OCR:n merkittävimmistä ominaisuuksista on sen laaja monikielinen tuki. Tesseract OCR -kirjasto tukee yli 100 kieltä, mikä tekee siitä ihanteellisen valinnan sovelluksiin, jotka käsittelevät asiakirjoja eri kielillä. Ohjelmistokehittäjät voivat määrittää haluamansa kielen (tai kielet), joita Tesseract käyttää, parantaen tunnistuksen tarkkuutta ei‑englanninkielisissä teksteissä. Alla on esimerkki, joka näyttää, miten ohjelmistokehittäjät voivat tunnistaa tekstiä ranskaksi Node.js‑sovelluksissa?

Kuinka tunnistaa tekstiä kuvasta ranskaksi JavaScript API:n avulla?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });