1. Produktai
  2.   OCR
  3.   JavaScript
  4.   Baidu-ocr-api
 
  

Free Node.js API to Recognize & Extract Text from Images

A Free Node.js is a Leading Node.js API that Offers High Accuracy in Text Recognition Across Multiple Languages and a Variety of Fonts and Layouts.

Šiandien dirbant AI varomoje plėtros aplinkoje, optinio simbolio atpažinimas (OCR) tapo būtinu įrankiu, automatizuojančiu teksto išgavimą iš vaizdų ir dokumentų. Kūrėjai, norintys sukurti OCR Node.js aplinkoje, gali labai pasinaudoti Baidu-OCR-API – galingu įrankiu, palaikančiu teksto išgavimą iš vaizdų, rankrašto teksto atpažinimą ir net pažangias užduotis, tokias kaip formų atpažinimas Node.js programose. Nesvarbu, ar skenuojate sąskaitas, skaitmeninate dokumentus, ar įgyvendinate prieinamumo funkcijas, ši Node.js OCR biblioteka siūlo aukštą našumą ir lengvai integruojama į šiuolaikines programas.

Baidu-OCR-API yra nemokama Node.js OCR API, kuri naudoja gilųjį mokymąsi spausdinto ir rankrašto teksto atpažinimui keliomis kalbomis, įskaitant kinų, anglų, japonų ir kt. Ji puikiai veikia lentelių atpažinime Node.js, verslo dokumentų skenavime ir teksto atpažinime sudėtingomis sąlygomis, pavyzdžiui, prasto apšvietimo ar iškraipytų vaizdų. Kūrėjai taip pat gali atpažinti tekstą natūraliose scenose, todėl API puikiai tinka mobiliosioms programoms, papildytos realybės sprendimams ir realaus laiko vertimo atvejams. Dėl savo tikslumo ir įvairiapusių panaudojimo galimybių Baidu-OCR-API yra idealus pasirinkimas bet kuriam kūrėjui, norinčiam integruoti patikimą OCR funkcionalumą į Node.js programas.

Previous Next

Pradžia su Baidu-OCR-API

Rekomenduojamas būdas įdiegti Baidu-OCR-API yra naudojant npm. Prašome naudoti šią komandą sklandžiam įdiegimui

Įdiegti Baidu-OCR-API per npm

 npm install baidu-ocr-api -g 

Taip pat galite įdiegti rankiniu būdu; atsisiųskite naujausius leidimo failus tiesiai iš GitHub saugyklos.

Išgauti tekstą iš vaizdų Node.js programose

Baidu-OCR-API leidžia programinės įrangos kūrėjams lengvai įkelti ir skaityti vaizdus bei išgauti tekstą Node.js programose. Bendroji teksto atpažinimo funkcija leidžia kūrėjams įkelti ir išgauti spausdintą tekstą iš vaizdų, tinkama plačiam dokumentų spektrui. API taip pat palaiko įvairius populiarius vaizdo failų formatus, tokius kaip JPEG, PNG, GIF, TIFF, PDF, BMP ir daugelį kitų. Žemiau pateiktas pavyzdys rodo, kaip kūrėjai gali įkelti ir atlikti teksto atpažinimą vaizde Node.js programose.

Kaip įkelti ir atlikti teksto atpažinimą vaizde Node.js programose?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Formų ir lentelių atpažinimas Node.js programose

Atviro kodo Baidu-OCR-API suteikia pilną funkcionalumą formų ir lentelių atpažinimui Node.js programose. Norint sėkmingai atlikti šią užduotį, pirmiausia reikia sukonfigūruoti Baidu OCR klientą naudojant jūsų API kredencialus. Tada parašykite kodą, kuris perskaitys vaizdą ir atliks formų bei lentelių atpažinimą. Ši funkcija ypač naudinga automatizuojant duomenų išgavimą iš struktūruotų dokumentų ir didinant produktyvumą įvairiose programose. Žemiau pateiktas paprastas pavyzdys rodo, kaip programinės įrangos kūrėjas gali perskaityti vaizdą ir atlikti formų bei lentelių atpažinimą Node.js aplinkoje.

Kaip perskaityti vaizdą ir atlikti formų bei lentelių atpažinimą Node.js programose?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Rankrašto teksto atpažinimas per Node.js API

Atviro kodo Baidu-OCR-API yra labai paprasta naudoti ir visiškai pajėgi atpažinti rankrašto tekstą su dideliu tikslumu Node.js programose. Norint pasiekti rezultatą, vaizdo failas perskaitomas ir konvertuojamas į base64 eilutę, po to iškviečiama rankrašto metodas su base64 koduotu vaizdu, o atpažintas rankrašto tekstas išvedamas į konsolę. Žemiau pateiktas pavyzdys rodo, kaip programinės įrangos kūrėjai gali atlikti rankrašto teksto atpažinimą naudojant atviro kodo Baidu OCR API Node.js aplinkoje.

Kaip atlikti rankrašto teksto atpažinimą Node.js programose?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word
 Lietuvių