1. Produse
  2.   OCR
  3.   Node.js
  4.   Node-Tesseract-OCR
 
  

API gratuit Node.js pentru a adăuga capabilități OCR proiectelor JS.

Bibliotecă OCR open source pentru Node.js care permite programatorilor să recunoască și să extragă text din diverse formate de fișiere, inclusiv imagini (JPEG, PNG), PDF-uri și documente, gratuit, în mai multe limbi.

Ce este Node-Tesseract-OCR?

În era digitală de astăzi, extragerea textului din imagini și documente a devenit o sarcină crucială în diverse industrii, inclusiv gestionarea documentelor, procesarea datelor și inteligența artificială. Tehnologia de recunoaștere optică a caracterelor (OCR) a făcut posibilă conversia documentelor scanate, imaginilor și PDF-urilor în formate de text editabile. Node-Tesseract-OCR este un API open-source care încorporează puterea motorului Tesseract OCR pentru a oferi o modalitate fluidă și eficientă de a efectua sarcini OCR în aplicații Node.js.

Node-Tesseract-OCR este un wrapper Node.js pentru motorul OCR Tesseract, permițând dezvoltatorilor să utilizeze funcționalitățile puternice de recunoaștere a textului ale Tesseract în mediul Node.js. API-ul este menținut în acest depozit GitHub și oferă o gamă de funcționalități care îl fac potrivit pentru diverse cazuri de utilizare, de la extragerea simplă a textului până la procesarea complexă a documentelor. Dezvoltatorii pot extrage text din imagini și documente în mai multe limbi, făcându-l un instrument versatil pentru multiple aplicații.

API-ul Node-Tesseract-OCR oferă capabilități avansate de procesare a imaginilor, inclusiv filtrare, redimensionare și decupare, pentru a asigura că textul extras este precis și de încredere. Suportă peste 100 de limbi, devenind o soluție versatilă pentru sarcini OCR în medii diverse. Dezvoltatorii pot extrage text din imagini, PDF-uri și documente și pot returna textul extras în diverse formate, cum ar fi JSON, XML și text simplu. Este conceput să fie ușor, flexibil și simplu de utilizat, fiind o alegere ideală pentru dezvoltatorii care doresc să adauge capabilități OCR proiectelor lor. Datorită capabilităților avansate de procesare a imaginilor, suportului lingvistic și mecanismelor de gestionare a erorilor, este o alegere ideală pentru dezvoltatorii care doresc să adauge capabilități OCR proiectelor lor.

Previous Next

Începerea utilizării Node-Tesseract-OCR

Cea mai recomandată metodă de instalare a Node-Tesseract-OCR este prin npm. Vă rugăm să utilizați comanda următoare pentru o instalare fără probleme

Instalați Node-Tesseract-OCR prin npm

npm install node-tesseract-ocr 

De asemenea, o puteți instala manual; descărcați fișierele ultimei versiuni direct din depozitul GitHub.

Extracția de text din imagini în API-ul Node.js

Biblioteca open source Node-Tesseract-OCR facilitează dezvoltatorilor crearea de aplicații care extrag automat text din imagini în cadrul aplicațiilor Node.js. Suportă extragerea de text din documente scanate, PDF-uri, fotografii realizate cu camera sau fotografii ale bonurilor. Acest lucru poate fi util pentru crearea de arhive căutabile, automatizarea introducerii de date sau procesarea unui volum mare de documente în sectoare precum finanțele și sănătatea. Iată un exemplu simplu care arată cum să extrageți programatic text din imagini în aplicațiile Node.js.

Cum să extrageți text din imagini în mediul Node.js?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Preprocesare îmbunătățită a imaginilor în Node.js

Preprocesarea imaginilor înainte de aplicarea OCR poate îmbunătăți semnificativ acuratețea recunoașterii textului. Biblioteca open source Node-Tesseract-OCR permite tehnici de preprocesare de bază, cum ar fi redimensionarea, binarizarea și corectarea înclinării. Acești pași pot fi implementați utilizând biblioteci suplimentare Node.js precum sharp sau jimp în combinație cu Node-Tesseract-OCR. Exemplul următor arată cum dezvoltatorii folosesc pașii de preprocesare pentru a îmbunătăți recunoașterea, în special pentru imagini de calitate inferioară.

Cum să aplicați pașii de preprocesare pentru a îmbunătăți recunoașterea prin API-ul Node.js?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Text recunoscut în mai multe limbi

Una dintre caracteristicile remarcabile ale Node-Tesseract-OCR este suportul său extins pentru mai multe limbi. Biblioteca Tesseract OCR suportă peste 100 de limbi, făcându‑la o alegere ideală pentru aplicații care trebuie să proceseze documente în diverse limbi. Dezvoltatorii pot specifica limba (limbile) pe care doresc să le folosească Tesseract, îmbunătățind acuratețea recunoașterii pentru texte non‑engleze. Iată un exemplu care arată cum dezvoltatorii pot recunoaște text în franceză în aplicațiile Node.js?

Cum să recunoașteți text din imagine în franceză prin API-ul JavaScript?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

 Română