Bezplatné Node.js API pro přidání OCR funkcí do JS projektů.
Open source knihovna OCR pro Node.js, která umožňuje programátorům rozpoznávat a extrahovat text z různých formátů souborů, včetně obrázků (JPEG, PNG), PDF a dokumentů zdarma ve více jazycích.
Co je Node-Tesseract-OCR?
V dnešní digitální éře se extrahování textu z obrázků a dokumentů stalo klíčovým úkolem v různých odvětvích, včetně správy dokumentů, zpracování dat a umělé inteligence. Technologie optického rozpoznávání znaků (OCR) umožnila převést naskenované dokumenty, obrázky a PDF do editovatelných textových formátů. Node-Tesseract-OCR je open‑source API, které využívá sílu OCR enginu Tesseract a poskytuje plynulý a efektivní způsob provádění OCR úloh v aplikacích Node.js.
Node-Tesseract-OCR je obal (wrapper) pro OCR engine Tesseract, který vývojářům umožňuje využívat výkonné funkce rozpoznávání textu Tesseract v prostředí Node.js. API je udržováno v tomto GitHub repozitáři a nabízí řadu funkcí, které jej činí vhodným pro různé scénáře – od jednoduchého extrahování textu po složitější zpracování dokumentů. Vývojáři mohou extrahovat text z obrázků a dokumentů v mnoha jazycích, což z něj dělá univerzální nástroj pro různé aplikace.
Node-Tesseract-OCR API poskytuje pokročilé možnosti zpracování obrázků, včetně filtrování, změny velikosti a ořezávání, aby byl extrahovaný text co nejpřesnější a spolehlivý. Podporuje více než 100 jazyků, což z něj činí všestranné řešení pro OCR úlohy v různorodých prostředích. Vývojáři mohou získat text z obrázků, PDF a dokumentů a vrátit jej v různých formátech, jako je JSON, XML nebo prostý text. Je navrženo tak, aby bylo lehké, flexibilní a snadno použitelné, což z něj dělá ideální volbu pro vývojáře, kteří chtějí do svých projektů přidat OCR funkce. Díky pokročilému zpracování obrázků, podpoře jazyků a mechanismům pro zpracování chyb je to skvělá volba pro vývojáře, kteří chtějí do svých projektů přidat OCR schopnosti.
Začínáme s Node-Tesseract-OCR
Doporučený způsob instalace Node-Tesseract-OCR je pomocí npm. Použijte následující příkaz pro hladkou instalaci
Instalace Node-Tesseract-OCR pomocí npm
npm install node-tesseract-ocr Můžete jej také nainstalovat ručně; stáhněte si nejnovější soubory přímo z GitHub repozitáře.
Extrahování textu z obrázků v Node.js API
Open source knihovna Node-Tesseract-OCR usnadňuje vývojářům vytvářet aplikace, které automaticky extrahují text z obrázků uvnitř Node.js aplikací. Podporuje extrahování textu ze skenovaných dokumentů, PDF, fotografií z kamery nebo fotografií účtenek. To může být užitečné pro vytváření prohledávatelných archivů, automatizaci zadávání dat nebo zpracování velkého objemu dokumentů v sektorech jako finance a zdravotnictví. Níže je jednoduchý příklad, který ukazuje, jak programově extrahovat text z obrázků v Node.js aplikacích.
Jak extrahovat text z obrázků v prostředí Node.js?
const tesseract = require("node-tesseract-ocr");
tesseract.recognize("path/to/image.jpg")
.then(text => {
console.log("Recognized Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Lepší předzpracování obrázků v Node.js
Předzpracování obrázků před aplikací OCR může výrazně zlepšit přesnost rozpoznávání textu. Open source knihovna Node-Tesseract-OCR umožňuje základní techniky předzpracování, jako je změna velikosti, binarizace a vyrovnání sklonu. Tyto kroky lze implementovat pomocí dalších knihoven Node.js, jako jsou sharp nebo jimp, ve spojení s Node-Tesseract-OCR. Následující příklad ukazuje, jak vývojáři používají předzpracování ke zlepšení rozpoznání, zejména u obrázků nižší kvality.
Jak aplikovat kroky předzpracování pro zlepšení rozpoznání pomocí Node.js API?
const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");
sharp("path/to/input.jpg")
.resize(800, 600) // Resize the image
.greyscale() // Convert to greyscale
.toBuffer()
.then(data => {
return tesseract.recognize(data, { lang: "eng" });
})
.then(text => {
console.log("Preprocessed Image Text:", text);
})
.catch(error => {
console.error("Error:", error.message);
});
Rozpoznaný text ve více jazycích
Jednou z nejvýraznějších vlastností Node-Tesseract-OCR je jeho rozsáhlá podpora více jazyků. Knihovna Tesseract OCR podporuje více než 100 jazyků, což z ní činí ideální volbu pro aplikace, které potřebují zpracovávat dokumenty v různých jazycích. Vývojáři mohou specifikovat jazyk(y), které chtějí, aby Tesseract použil, čímž zvyšují přesnost rozpoznání pro texty mimo angličtinu. Níže je příklad, který ukazuje, jak vývojáři mohou rozpoznat text ve francouzštině v Node.js aplikacích?
Jak rozpoznat text z obrázku ve francouzštině pomocí JavaScript API?
const config = {
lang: "fra", // French language support
oem: 1,
psm: 3
};
tesseract.recognize("path/to/french-text-image.jpg", config)
.then(text => {
console.log("Recognized Text in French:", text);
})
.catch(error => {
console.error("Error:", error.message);
});