Безплатен Node.js API за разпознаване и извличане на текст от изображения
Безплатният Node.js е водещ Node.js API, който предлага висока точност при разпознаване на текст на множество езици и разнообразие от шрифтове и оформления.
В днешния свят на разработка, задвижван от AI, оптичното разпознаване на знаци (OCR) се превърна в съществено за автоматизиране на извличането на текст от изображения и документи. Разработчиците, които искат да създадат OCR в Node.js, могат да се възползват значително от Baidu-OCR-API, мощен инструмент, който поддържа извличане на текст от изображения, разпознаване на ръкописен текст и дори напреднали задачи като разпознаване на формуляри в Node.js приложения. Независимо дали става въпрос за сканиране на фактури, дигитализиране на документи или осигуряване на функции за достъпност, тази Node.js OCR библиотека предлага висока производителност и е лесна за интегриране с модерни приложения.
Baidu-OCR-API е безплатен Node.js OCR API, който използва дълбоко обучение за разпознаване на печатен и ръкописен текст на множество езици, включително китайски, английски, японски и други. Той се отличава в разпознаването на таблици в Node.js, сканиране на бизнес документи и разпознаване на текст в сложни условия като слаба светлина или изкривени изображения. Разработчиците могат също така да разпознават текст в естествени сцени, което го прави перфектен за мобилни приложения, разширена реалност и случаи на превод в реално време. Със своята точна разпознаваемост и разнообразни случаи на употреба, Baidu-OCR-API е идеален избор за всеки разработчик, който иска да интегрира надеждна OCR функционалност в Node.js приложения.
Започване с Baidu-OCR-API
Препоръчителният начин за инсталиране на Baidu-OCR-API е чрез npm. Моля, използвайте следната команда за гладка инсталация
Инсталиране на Baidu-OCR-API чрез npm
npm install baidu-ocr-api -g Можете също така да го инсталирате ръчно; изтеглете последните файлове от GitHub репозитория.
Извличане на текст от изображения в Node.js приложения
Baidu-OCR-API улеснява софтуерните разработчици да зареждат и четат изображения и да извличат текст в Node.js приложения. Функцията за общо разпознаване на текст позволява на разработчиците да зареждат и извличат печатен текст от изображения, подходящ за широк спектър от документи. API‑то включва поддръжка за различни популярни файлови формати за изображения, като JPEG, PNG, GIF, TIFF, PDF, BMP и много други. Следният пример показва как софтуерните разработчици могат да заредят и извършат разпознаване на текст върху изображението в Node.js приложения.
Как да заредим и извършим разпознаване на текст върху изображение в Node.js приложения?
//Read image
const fs = require('fs');
// Read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
const image = readImage('path_to_your_image.jpg');
// Perform OCR
client.generalBasic(image).then(result => {
console.log('Recognized Text:');
result.words_result.forEach(wordInfo => {
console.log(wordInfo.words);
});
}).catch(err => {
console.error(err);
});
Разпознаване на формуляри и таблици в Node.js приложения
Отвореният код Baidu-OCR-API предоставя пълна функционалност за разпознаване на формуляри и таблици в Node.js приложения. За успешно изпълнение на задачата първо трябва да настроите вашия Baidu OCR клиент, използвайки вашите API идентификационни данни. След това напишете кода за четене на изображение и извършване на разпознаване на формуляри и таблици. Тази функционалност може да бъде особено полезна за автоматизиране на извличане на данни от структурирани документи и подобряване на продуктивността в различни приложения. Ето прост пример, който показва как софтуерният разработчик може да прочете изображение и да извърши разпознаване на формуляри и таблици в Node.js среда.
Как да прочетете изображение и да извършите разпознаване на формуляри и таблици в Node.js приложения?
const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');
// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';
// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);
// Function to read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Form and Table Recognition
client.form(image).then(result => {
console.log('Form and Table Data:');
console.log(JSON.stringify(result, null, 2));
}).catch(err => {
console.error('Error:', err);
});
Разпознаване на ръкописен текст чрез Node.js API
Отвореният код Baidu-OCR-API е много лесен за използване и е напълно способен да разпознава ръкописен текст с висока точност в Node.js приложения. За постигане на целта файлът с изображението се чете и конвертира в base64 низ, след което се извиква методът за ръкописен текст с base64‑кодираното изображение, а разпознатият ръкописен текст се записва в конзолата. Следният пример демонстрира как софтуерните разработчици могат да извършат разпознаване на ръкописен текст, използвайки отворения код Baidu OCR API в Node.js.
Как да извършите разпознаване на ръкописен текст в Node.js приложения?
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
console.log('Recognized Handwritten Text:');
result.words_result.forEach(wordInfo => {
console.log(word