1. Termékek
  2.   OCR
  3.   Node.js
  4.   Baidu-ocr-api
 
  

Free Node.js API to Recognize & Extract Text from Images

A Free Node.js is a Leading Node.js API that Offers High Accuracy in Text Recognition Across Multiple Languages and a Variety of Fonts and Layouts.

Manapság, az AI-vezérelt fejlesztési világban az optikai karakterfelismerés (OCR) alapvetővé vált a képekből és dokumentumokból történő szövegkinyerés automatizálásához. A Node.js-ben OCR-t szerető fejlesztők jelentős előnyökhöz juthatnak a Baidu-OCR-API segítségével, amely egy erőteljes eszköz, és támogatja a képekből történő szövegkinyerést, a kézírás felismerését, sőt fejlett feladatokat is, mint például az űrlapfelismerés Node.js alkalmazásokban. Legyen szó számlák beolvasásáról, dokumentumok digitalizálásáról vagy akadálymentesítési funkciók engedélyezéséről, ez a Node.js OCR könyvtár magas teljesítményt nyújt, és könnyen integrálható a modern alkalmazásokba.

A Baidu-OCR-API egy ingyenes Node.js OCR API, amely mélytanulást használ a nyomtatott és kézírásos szöveg felismerésére több nyelven, köztük kínai, angol, japán és még sok más. Kiválóan teljesít táblázatfelismerésben Node.js környezetben, üzleti dokumentumok beolvasásában, valamint nehéz körülmények (gyenge fény, torzított képek) esetén is. A fejlesztők természetes jelenetekben is felismerhetnek szöveget, ami tökéletes mobilalkalmazásokhoz, kiterjesztett valósághoz és valós idejű fordítási felhasználási esetekhez. Pontos felismerésével és sokoldalú felhasználási eseteivel a Baidu-OCR-API ideális választás minden fejlesztő számára, aki megbízható OCR funkciót szeretne integrálni Node.js alkalmazásaiba.

Previous Next

A Baidu-OCR-API használatának megkezdése

A Baidu-OCR-API ajánlott telepítési módja az npm használata. Kérjük, futtassa az alábbi parancsot a zökkenőmentes telepítéshez.

Baidu-OCR-API telepítése npm segítségével

 npm install baidu-ocr-api -g 

Telepítheti kézzel is; a legújabb kiadási fájlokat közvetlenül a GitHub tárolóból töltheti le.

Szöveg kinyerése képekből Node.js alkalmazásokban

A Baidu-OCR-API megkönnyíti a fejlesztők számára a képek betöltését és a szöveg kinyerését Node.js alkalmazásokban. Az általános szövegfelismerő funkció lehetővé teszi a nyomtatott szöveg betöltését és kinyerését képekből, ami széles körű dokumentumokhoz alkalmas. Az API támogatja a különböző népszerű képfájl-formátumokat, mint a JPEG, PNG, GIF, TIFF, PDF, BMP és még sok más. Az alábbi példa bemutatja, hogyan tud egy fejlesztő képet betölteni és szövegfelismerést végrehajtani Node.js alkalmazásban.

Hogyan töltsünk be és hajtsunk végre szövegfelismerést egy képen Node.js alkalmazásokban?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Űrlap- és táblázatfelismerés Node.js alkalmazásokban

A nyílt forráskódú Baidu-OCR-API teljes funkcionalitást biztosít űrlap- és táblázatfelismeréshez Node.js környezetben. A feladat sikeres végrehajtásához először be kell állítania a Baidu OCR klienst a saját API hitelesítő adataival. Ezután írja meg a kódot a kép beolvasásához és az űrlap- és táblázatfelismeréshez. Ez a funkció különösen hasznos lehet strukturált dokumentumok adatkinyerésének automatizálásához és a termelékenység növeléséhez különféle alkalmazásokban. Az alábbi egyszerű példa megmutatja, hogyan tud egy fejlesztő képet beolvasni és űrlap- és táblázatfelismerést végrehajtani Node.js környezetben.

Hogyan olvassunk be egy képet és hajtsunk végre űrlap- és táblázatfelismerést Node.js alkalmazásokban?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Kézírásos szövegfelismerés Node.js API-n keresztül

A nyílt forráskódú Baidu-OCR-API nagyon könnyen kezelhető, és teljes mértékben képes a kézírásos szöveg magas pontosságú felismerésére Node.js alkalmazásokban. A cél eléréséhez a képfájlt beolvassuk és base64 karakterlánccá alakítjuk, majd a handwriting metódust meghívjuk a base64‑kódolt képpel, és a felismert kézírásos szöveget a konzolra írjuk. Az alábbi példa bemutatja, hogyan hajthatnak végre fejlesztők kézírásos szövegfelismerést a nyílt forráskódú Baidu OCR API-val Node.js-ben.

Hogyan hajtsunk végre kézírásos szövegfelismerést Node.js alkalmazásokban?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word
 Magyar