Бесплатный API Node.js для распознавания и извлечения текста из изображений

Бесплатный Node.js — ведущий API, обеспечивающий высокую точность распознавания текста на множестве языков и различных шрифтов и макетов.

В современном мире разработки, управляемой ИИ, оптическое распознавание символов (OCR) стало необходимым для автоматизации извлечения текста из изображений и документов. Разработчики, желающие создать OCR в Node.js, могут значительно выиграть, используя Baidu-OCR-API — мощный инструмент, поддерживающий извлечение текста из изображений, распознавание рукописного текста и даже продвинутые задачи, такие как распознавание форм внутри приложений Node.js. Будь то сканирование счетов, оцифровка документов или обеспечение функций доступности, эта библиотека OCR для Node.js предлагает высокую производительность и простую интеграцию с современными приложениями.

Baidu-OCR-API — бесплатный OCR API для Node.js, использующий глубокое обучение для распознавания печатного и рукописного текста на множестве языков, включая китайский, английский, японский и другие. Он отлично справляется с распознаванием таблиц в Node.js, сканированием бизнес‑документов и распознаванием текста в сложных условиях, таких как низкая освещённость или искажённые изображения. Разработчики также могут распознавать текст в естественных сценах, что делает его идеальным для мобильных приложений, дополненной реальности и сценариев реального времени перевода. Благодаря точному распознаванию и широкому спектру применений Baidu-OCR-API является отличным выбором для любого разработчика, желающего интегрировать надёжный OCR в приложения Node.js.

Обзор

Обзор возможностей Baidu-OCR-API.

Обзор функций

Выполнять OCR
Добавлять возможности OCR
Распознавать текст на изображениях
Конвертировать изображения текста
Распознавать шрифтовый текст
Поиск по PDF
Более 100 языков
Создавать OCR‑приложения
Сохранять в браузере
Извлекать текст
Поддержка многопоточности

Baidu-OCR-API

Baidu-OCR-API поддерживает популярные форматы файлов изображений, перечисленные ниже.

Чтение

PNG, JPEG, BMP, TIFF, TGA, DICOM

Запись

PNG, JPEG, BMP, TIFF

Baidu-OCR-API

Платформенная независимость

Baidu-OCR-API может работать с любым языком программирования, основанным на Java

Java

Baidu-OCR-API

Начало работы с Baidu-OCR-API

Рекомендуемый способ установки Baidu-OCR-API — использование npm. Пожалуйста, выполните следующую команду для беспроблемной установки

Установить Baidu-OCR-API через npm

 npm install baidu-ocr-api -g

Вы также можете установить его вручную; загрузите последние файлы релиза напрямую из репозитория GitHub.

Извлечение текста из изображений в приложениях Node.js

Baidu-OCR-API упрощает для разработчиков загрузку и чтение изображений и извлечение текста внутри приложений Node.js. Функция общего распознавания текста позволяет загружать и извлекать печатный текст из изображений, что подходит для широкого спектра документов. API поддерживает различные популярные форматы изображений, такие как JPEG, PNG, GIF, TIFF, PDF, BMP и многие другие. Ниже приведён пример, показывающий, как разработчики могут загрузить изображение и выполнить распознавание текста внутри приложений Node.js.

Как загрузить изображение и выполнить распознавание текста в приложениях Node.js?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Распознавание форм и таблиц в приложениях Node.js

Открытый Baidu-OCR-API предоставляет полную функциональность для распознавания форм и таблиц внутри приложений Node.js. Чтобы успешно выполнить задачу, сначала необходимо настроить клиент Baidu OCR, используя ваши учётные данные API. Затем напишите код для чтения изображения и выполнения распознавания форм и таблиц. Эта возможность особенно полезна для автоматизации извлечения данных из структурированных документов и повышения продуктивности в различных приложениях. Ниже простой пример, показывающий, как разработчик может прочитать изображение и выполнить распознавание форм и таблиц в среде Node.js.

Как прочитать изображение и выполнить распознавание форм и таблиц в приложениях Node.js?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Распознавание рукописного текста через Node.js API

Открытый Baidu-OCR-API очень прост в использовании и полностью способен распознавать рукописный текст с высокой точностью в приложениях Node.js. Для достижения цели файл изображения читается и конвертируется в строку base64, после чего вызывается метод handwriting с закодированным изображением, а распознанный рукописный текст выводится в консоль. Ниже пример, демонстрирующий, как разработчики могут выполнять распознавание рукописного текста, используя открытый Baidu OCR API в Node.js.

Как выполнить распознавание рукописного текста в приложениях Node.js?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word