Bezplatné Node.js API pro přidání OCR funkcí do JS projektů.

Open source knihovna OCR pro Node.js, která umožňuje programátorům rozpoznávat a extrahovat text z různých formátů souborů, včetně obrázků (JPEG, PNG), PDF a dokumentů zdarma ve více jazycích.

Co je Node-Tesseract-OCR?

V dnešní digitální éře se extrahování textu z obrázků a dokumentů stalo klíčovým úkolem v různých odvětvích, včetně správy dokumentů, zpracování dat a umělé inteligence. Technologie optického rozpoznávání znaků (OCR) umožnila převést naskenované dokumenty, obrázky a PDF do editovatelných textových formátů. Node-Tesseract-OCR je open‑source API, které využívá sílu OCR enginu Tesseract a poskytuje plynulý a efektivní způsob provádění OCR úloh v aplikacích Node.js.

Node-Tesseract-OCR je obal (wrapper) pro OCR engine Tesseract, který vývojářům umožňuje využívat výkonné funkce rozpoznávání textu Tesseract v prostředí Node.js. API je udržováno v tomto GitHub repozitáři a nabízí řadu funkcí, které jej činí vhodným pro různé scénáře – od jednoduchého extrahování textu po složitější zpracování dokumentů. Vývojáři mohou extrahovat text z obrázků a dokumentů v mnoha jazycích, což z něj dělá univerzální nástroj pro různé aplikace.

Node-Tesseract-OCR API poskytuje pokročilé možnosti zpracování obrázků, včetně filtrování, změny velikosti a ořezávání, aby byl extrahovaný text co nejpřesnější a spolehlivý. Podporuje více než 100 jazyků, což z něj činí všestranné řešení pro OCR úlohy v různorodých prostředích. Vývojáři mohou získat text z obrázků, PDF a dokumentů a vrátit jej v různých formátech, jako je JSON, XML nebo prostý text. Je navrženo tak, aby bylo lehké, flexibilní a snadno použitelné, což z něj dělá ideální volbu pro vývojáře, kteří chtějí do svých projektů přidat OCR funkce. Díky pokročilému zpracování obrázků, podpoře jazyků a mechanismům pro zpracování chyb je to skvělá volba pro vývojáře, kteří chtějí do svých projektů přidat OCR schopnosti.

Na první pohled

Přehled funkcí Node-Tesseract-OCR.

Features Overview

Provádět OCR
Přidat OCR funkce
Rozpoznat text na obrázku
Převést obrázky s textem
Rozpoznaný text písma
Prohledat PDF
Více než 100 jazyků
Vytvořit OCR aplikace
Uložit do prohlížeče
Extrahovat text
Podpora více vláken

Node-Tesseract-OCR

Node-Tesseract-OCR podporuje populární formáty obrázků uvedené níže.

Čteč

PNG, JPEG, BMP, TIFF, TGA, DICOM

Zapisovač

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

Platformová nezávislost

Node-Tesseract-OCR může pracovat s jakýmkoli programovacím jazykem založeným na Javě

Java

Node-Tesseract-OCR

Začínáme s Node-Tesseract-OCR

Doporučený způsob instalace Node-Tesseract-OCR je pomocí npm. Použijte následující příkaz pro hladkou instalaci

Instalace Node-Tesseract-OCR pomocí npm

npm install node-tesseract-ocr

Můžete jej také nainstalovat ručně; stáhněte si nejnovější soubory přímo z GitHub repozitáře.

Extrahování textu z obrázků v Node.js API

Open source knihovna Node-Tesseract-OCR usnadňuje vývojářům vytvářet aplikace, které automaticky extrahují text z obrázků uvnitř Node.js aplikací. Podporuje extrahování textu ze skenovaných dokumentů, PDF, fotografií z kamery nebo fotografií účtenek. To může být užitečné pro vytváření prohledávatelných archivů, automatizaci zadávání dat nebo zpracování velkého objemu dokumentů v sektorech jako finance a zdravotnictví. Níže je jednoduchý příklad, který ukazuje, jak programově extrahovat text z obrázků v Node.js aplikacích.

Jak extrahovat text z obrázků v prostředí Node.js?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Lepší předzpracování obrázků v Node.js

Předzpracování obrázků před aplikací OCR může výrazně zlepšit přesnost rozpoznávání textu. Open source knihovna Node-Tesseract-OCR umožňuje základní techniky předzpracování, jako je změna velikosti, binarizace a vyrovnání sklonu. Tyto kroky lze implementovat pomocí dalších knihoven Node.js, jako jsou sharp nebo jimp, ve spojení s Node-Tesseract-OCR. Následující příklad ukazuje, jak vývojáři používají předzpracování ke zlepšení rozpoznání, zejména u obrázků nižší kvality.

Jak aplikovat kroky předzpracování pro zlepšení rozpoznání pomocí Node.js API?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Rozpoznaný text ve více jazycích

Jednou z nejvýraznějších vlastností Node-Tesseract-OCR je jeho rozsáhlá podpora více jazyků. Knihovna Tesseract OCR podporuje více než 100 jazyků, což z ní činí ideální volbu pro aplikace, které potřebují zpracovávat dokumenty v různých jazycích. Vývojáři mohou specifikovat jazyk(y), které chtějí, aby Tesseract použil, čímž zvyšují přesnost rozpoznání pro texty mimo angličtinu. Níže je příklad, který ukazuje, jak vývojáři mohou rozpoznat text ve francouzštině v Node.js aplikacích?

Jak rozpoznat text z obrázku ve francouzštině pomocí JavaScript API?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });