Ingyenes Node.js API a képek szövegének felismerésére és kinyerésére

Az ingyenes Node.js egy vezető Node.js API, amely magas pontosságú szövegfelismerést kínál több nyelven és különféle betűtípusok és elrendezések esetén.

Manapság az AI által vezérelt fejlesztési világban az optikai karakterfelismerés (OCR) elengedhetetlen a képek és dokumentumok szövegének automatikus kinyeréséhez. A Node.js-ben OCR létrehozására törekvő fejlesztők jelentős előnyökhöz juthatnak a Baidu-OCR-API segítségével, amely egy erőteljes eszköz a képek szövegének kinyeréséhez, kézírás felismeréséhez, sőt fejlett feladatokhoz, például űrlapfelismeréshez a Node.js alkalmazásokban. Legyen szó számlák beolvasásáról, dokumentumok digitalizálásáról vagy akadálymentesítési funkciók engedélyezéséről, ez a Node.js OCR könyvtár magas teljesítményt nyújt és könnyen integrálható a modern alkalmazásokba.

A Baidu-OCR-API egy ingyenes Node.js OCR API, amely mélytanulást használ a nyomtatott és kézírásos szöveg felismerésére több nyelven, köztük kínai, angol, japán és még sok más nyelven. Kiemelkedő a táblázatfelismerésben Node.js környezetben, üzleti dokumentumok beolvasásában, valamint a nehéz körülmények (gyenge fény, torzított képek) közötti szöveg felismerésében. A fejlesztők természetes jelenetekben is felismerhetnek szöveget, ami tökéletes mobilalkalmazásokhoz, kiterjesztett valósághoz és valós idejű fordítási felhasználásokhoz. Pontos felismerésével és sokoldalú felhasználási eseteivel a Baidu-OCR-API ideális választás minden fejlesztő számára, aki megbízható OCR funkciót szeretne integrálni Node.js alkalmazásaiba.

Áttekintés

A Baidu-OCR-API funkcióinak áttekintése.

Funkciók áttekintése

OCR végrehajtása
OCR képességek hozzáadása
Képszöveg felismerése
Szöveges képek konvertálása
Felismert betűtípus szöveg
PDF keresése
Több mint 100 nyelv
OCR alkalmazások létrehozása
Mentés böngészőbe
Szöveg kinyerése
Többszálú támogatás

Baidu-OCR-API

A Baidu-OCR-API támogatja az alább felsorolt népszerű képformátumokat.

Olvasó

PNG, JPEG, BMP, TIFF, TGA, DICOM

Író

PNG, JPEG, BMP, TIFF

Baidu-OCR-API

Platformfüggetlenség

A Baidu-OCR-API bármely Java-alapú programozási nyelvvel működik

Java

Baidu-OCR-API

Első lépések a Baidu-OCR-API-val

Az ajánlott módja a Baidu-OCR-API telepítésének az npm használata. Kérjük, használja az alábbi parancsot a zökkenőmentes telepítéshez

Telepítse a Baidu-OCR-API-t npm‑el

 npm install baidu-ocr-api -g

Telepítheti kézzel is; töltse le a legújabb kiadási fájlokat közvetlenül a GitHub tárolóból.

Szöveg kinyerése képekből Node.js alkalmazásokban

A Baidu-OCR-API megkönnyíti a szoftverfejlesztők számára a képek betöltését és olvasását, valamint a szöveg kinyerését a Node.js alkalmazásokban. Az általános szövegfelismerő funkció lehetővé teszi a fejlesztőknek, hogy nyomtatott szöveget töltsenek be és nyerjenek ki képekből, ami számos dokumentumtípusra alkalmas. Az API támogatja a különböző népszerű képformátumokat, például a JPEG, PNG, GIF, TIFF, PDF, BMP és még sok más formátumot. Az alábbi példa bemutatja, hogyan tölthet be és hajthat végre szövegfelismerést egy képen a Node.js alkalmazásokban.

Hogyan töltsön be és hajtson végre szövegfelismerést egy képen Node.js alkalmazásokban?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Űrlap- és táblázatfelismerés Node.js alkalmazásokban

Az nyílt forráskódú Baidu-OCR-API teljes funkcionalitást biztosít az űrlap- és táblázatfelismeréshez a Node.js alkalmazásokban. A feladat sikeres végrehajtásához először be kell állítania a Baidu OCR klienst az API hitelesítő adataival. Ezután írja meg a kódot a kép beolvasásához és az űrlap- és táblázatfelismeréshez. Ez a funkció különösen hasznos lehet strukturált dokumentumok adatkinyerésének automatizálásához és a termelékenység növeléséhez különböző alkalmazásokban. Az alábbi egyszerű példa azt mutatja, hogyan olvashat be egy képet és hajthat végre űrlap- és táblázatfelismerést a Node.js környezetben.

Hogyan olvasson be egy képet és hajtson végre űrlap- és táblázatfelismerést Node.js alkalmazásokban?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Kézírásos szövegfelismerés Node.js API-n keresztül

Az nyílt forráskódú Baidu-OCR-API nagyon könnyen kezelhető, és teljes mértékben képes a kézírásos szöveg magas pontosságú felismerésére a Node.js alkalmazásokban. A cél eléréséhez a kép fájlt beolvassuk és base64 karakterlánccá alakítjuk, majd a handwriting metódust meghívjuk a base64‑kódolt képpel, és a felismert kézírásos szöveget a konzolra írjuk. Az alábbi példa bemutatja, hogyan hajthat végre kézírásos szövegfelismerést a nyílt forráskódú Baidu OCR API-val Node.js‑ben.

Hogyan hajtson végre kézírásos szövegfelismerést Node.js alkalmazásokban?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word