Nemokama Node.js API, skirta atpažinti ir išgauti tekstą iš vaizdų
Nemokama Node.js yra pirmaujanti Node.js API, siūlanti aukštą tikslumą teksto atpažinime keliomis kalbomis ir įvairiais šriftais bei išdėstymais.
Šiandien AI valdomame kūrimo pasaulyje optinis teksto atpažinimas (OCR) tapo būtinu automatizuotam teksto išgavimui iš vaizdų ir dokumentų. Kūrėjai, siekiantys sukurti OCR Node.js, gali labai pasinaudoti Baidu-OCR-API, galingu įrankiu, kuris palaiko teksto išgavimą iš vaizdų, ranka rašyto teksto atpažinimą ir net pažangias užduotis, tokias kaip formų atpažinimas Node.js programose. Nesvarbu, ar tai sąskaitų faktūrų skenavimas, dokumentų skaitmeninimas, ar prieinamumo funkcijų įgalinimas, ši Node.js OCR biblioteka siūlo aukštą našumą ir yra lengvai integruojama į šiuolaikines programas.
Baidu-OCR-API yra nemokama Node.js OCR API, kuri naudoja gilųjį mokymąsi atpažinti spausdintą ir ranka rašytą tekstą keliomis kalbomis, įskaitant kinų, anglų, japonų ir kt. Ji puikiai veikia lentelių atpažinime Node.js, verslo dokumentų skenavime ir teksto atpažinime sudėtingomis sąlygomis, pvz., prasto apšvietimo ar iškraipytų vaizdų. Kūrėjai taip pat gali atpažinti tekstą natūraliose scenose, todėl tai puikiai tinka mobiliosioms programoms, papildytai realybei ir realaus laiko vertimo scenarijams. Dėl savo tikslumo ir universalumo Baidu-OCR-API yra idealus pasirinkimas bet kuriam kūrėjui, norinčiam integruoti patikimą OCR funkcionalumą į Node.js programas.
Pradžia su Baidu-OCR-API
Rekomenduojamas būdas įdiegti Baidu-OCR-API yra naudojant npm. Prašome naudoti šią komandą sklandžiam įdiegimui
Install Baidu-OCR-APIvia npm
npm install baidu-ocr-api -g Taip pat galite įdiegti rankiniu būdu; atsisiųskite naujausius leidimo failus tiesiai iš GitHub saugyklos.
Išgauti tekstą iš vaizdų Node.js programose
Baidu-OCR-API palengvina programinės įrangos kūrėjams įkelti ir skaityti vaizdus bei išgauti tekstą Node.js programose. Bendro teksto atpažinimo funkcija leidžia kūrėjams įkelti ir išgauti spausdintą tekstą iš vaizdų, tinkamą plačiai dokumentų įvairovei. API palaiko įvairius populiarius vaizdo failų formatus, tokius kaip JPEG, PNG, GIF, TIFF, PDF, BMP ir daugelį kitų. Žemiau pateiktas pavyzdys rodo, kaip programinės įrangos kūrėjai gali įkelti ir atlikti teksto atpažinimą vaizde Node.js programose.
How to Load and Perform Text Recognition on an Image inside Node.js Apps?
//Read image
const fs = require('fs');
// Read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
const image = readImage('path_to_your_image.jpg');
// Perform OCR
client.generalBasic(image).then(result => {
console.log('Recognized Text:');
result.words_result.forEach(wordInfo => {
console.log(wordInfo.words);
});
}).catch(err => {
console.error(err);
});
Formų ir lentelių atpažinimas Node.js programose
Atviro kodo Baidu-OCR-API suteikia pilną funkcionalumą formų ir lentelių atpažinimui Node.js programose. Norint sėkmingai atlikti užduotį, pirmiausia reikia sukonfigūruoti Baidu OCR klientą naudodami savo API kredencialus. Tada parašykite kodą, kad įkeltumėte vaizdą ir atliktumėte formų bei lentelių atpažinimą. Ši funkcija ypač naudinga automatizuojant duomenų išgavimą iš struktūruotų dokumentų ir didinant produktyvumą įvairiose programose. Čia pateiktas paprastas pavyzdys, kuris rodo, kaip programinės įrangos kūrėjas gali įkelti vaizdą ir atlikti formų bei lentelių atpažinimą Node.js aplinkoje.
How to Read an Image and Perform Form and Table Recognition in Node.js Apps?
const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');
// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';
// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);
// Function to read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Form and Table Recognition
client.form(image).then(result => {
console.log('Form and Table Data:');
console.log(JSON.stringify(result, null, 2));
}).catch(err => {
console.error('Error:', err);
});
Rankrašto teksto atpažinimas per Node.js API
Atviro kodo Baidu-OCR-API yra labai lengvai naudojama ir visiškai pajėgi atpažinti ranka rašytą tekstą su dideliu tikslumu Node.js programose. Norint pasiekti tikslą, vaizdo failas perskaitomas ir konvertuojamas į base64 eilutę, po to rankrašto metodas iškviečiamas su base64 koduotu vaizdu, o atpažintas rankrašto tekstas išvedamas į konsolę. Žemiau pateiktas pavyzdys demonstruoja, kaip programinės įrangos kūrėjai gali atlikti rankrašto teksto atpažinimą naudojant atviro kodo Baidu OCR API Node.js aplinkoje.
How to Perform Handwriting Text Recognition inside Node.js Apps?
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
console.log('Recognized Handwritten Text:');
result.words_result.forEach(wordInfo => {
console.log(word