Бесплатный API Node.js для распознавания и извлечения текста из изображений
Бесплатный Node.js — ведущий API, обеспечивающий высокую точность распознавания текста на множестве языков и различных шрифтов и макетов.
В современном мире разработки, управляемой ИИ, оптическое распознавание символов (OCR) стало необходимым для автоматизации извлечения текста из изображений и документов. Разработчики, желающие создать OCR в Node.js, могут значительно выиграть, используя Baidu-OCR-API — мощный инструмент, поддерживающий извлечение текста из изображений, распознавание рукописного текста и даже продвинутые задачи, такие как распознавание форм внутри приложений Node.js. Будь то сканирование счетов, оцифровка документов или обеспечение функций доступности, эта библиотека OCR для Node.js предлагает высокую производительность и простую интеграцию с современными приложениями.
Baidu-OCR-API — бесплатный OCR API для Node.js, использующий глубокое обучение для распознавания печатного и рукописного текста на множестве языков, включая китайский, английский, японский и другие. Он отлично справляется с распознаванием таблиц в Node.js, сканированием бизнес‑документов и распознаванием текста в сложных условиях, таких как низкая освещённость или искажённые изображения. Разработчики также могут распознавать текст в естественных сценах, что делает его идеальным для мобильных приложений, дополненной реальности и сценариев реального времени перевода. Благодаря точному распознаванию и широкому спектру применений Baidu-OCR-API является отличным выбором для любого разработчика, желающего интегрировать надёжный OCR в приложения Node.js.
Начало работы с Baidu-OCR-API
Рекомендуемый способ установки Baidu-OCR-API — использование npm. Пожалуйста, выполните следующую команду для беспроблемной установки
Установить Baidu-OCR-API через npm
npm install baidu-ocr-api -g Вы также можете установить его вручную; загрузите последние файлы релиза напрямую из репозитория GitHub.
Извлечение текста из изображений в приложениях Node.js
Baidu-OCR-API упрощает для разработчиков загрузку и чтение изображений и извлечение текста внутри приложений Node.js. Функция общего распознавания текста позволяет загружать и извлекать печатный текст из изображений, что подходит для широкого спектра документов. API поддерживает различные популярные форматы изображений, такие как JPEG, PNG, GIF, TIFF, PDF, BMP и многие другие. Ниже приведён пример, показывающий, как разработчики могут загрузить изображение и выполнить распознавание текста внутри приложений Node.js.
Как загрузить изображение и выполнить распознавание текста в приложениях Node.js?
//Read image
const fs = require('fs');
// Read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
const image = readImage('path_to_your_image.jpg');
// Perform OCR
client.generalBasic(image).then(result => {
console.log('Recognized Text:');
result.words_result.forEach(wordInfo => {
console.log(wordInfo.words);
});
}).catch(err => {
console.error(err);
});
Распознавание форм и таблиц в приложениях Node.js
Открытый Baidu-OCR-API предоставляет полную функциональность для распознавания форм и таблиц внутри приложений Node.js. Чтобы успешно выполнить задачу, сначала необходимо настроить клиент Baidu OCR, используя ваши учётные данные API. Затем напишите код для чтения изображения и выполнения распознавания форм и таблиц. Эта возможность особенно полезна для автоматизации извлечения данных из структурированных документов и повышения продуктивности в различных приложениях. Ниже простой пример, показывающий, как разработчик может прочитать изображение и выполнить распознавание форм и таблиц в среде Node.js.
Как прочитать изображение и выполнить распознавание форм и таблиц в приложениях Node.js?
const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');
// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';
// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);
// Function to read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Form and Table Recognition
client.form(image).then(result => {
console.log('Form and Table Data:');
console.log(JSON.stringify(result, null, 2));
}).catch(err => {
console.error('Error:', err);
});
Распознавание рукописного текста через Node.js API
Открытый Baidu-OCR-API очень прост в использовании и полностью способен распознавать рукописный текст с высокой точностью в приложениях Node.js. Для достижения цели файл изображения читается и конвертируется в строку base64, после чего вызывается метод handwriting с закодированным изображением, а распознанный рукописный текст выводится в консоль. Ниже пример, демонстрирующий, как разработчики могут выполнять распознавание рукописного текста, используя открытый Baidu OCR API в Node.js.
Как выполнить распознавание рукописного текста в приложениях Node.js?
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
console.log('Recognized Handwritten Text:');
result.words_result.forEach(wordInfo => {
console.log(word