Безкоштовний Node.js API для розпізнавання та видобування тексту з зображень

Безкоштовний Node.js — провідний Node.js API, який забезпечує високу точність розпізнавання тексту на багатьох мовах та різноманітних шрифтах і макетах.

У сучасному світі розробки, орієнтованому на ШІ, оптичне розпізнавання символів (OCR) стало незамінним для автоматизації видобування тексту з зображень та документів. Розробники, які хочуть створювати OCR у Node.js, можуть значно виграти, використовуючи Baidu-OCR-API — потужний інструмент, що підтримує видобування тексту з зображень, розпізнавання рукописного тексту та навіть складні завдання, такі як розпізнавання форм у Node.js‑додатках. Будь‑то сканування рахунків, оцифрування документів або забезпечення функцій доступності, ця бібліотека OCR для Node.js пропонує високу продуктивність і легку інтеграцію в сучасні застосунки.

Baidu-OCR-API — безкоштовний Node.js OCR API, який використовує глибоке навчання для розпізнавання друкованого та рукописного тексту на багатьох мовах, включаючи китайську, англійську, японську тощо. Він відмінно справляється з розпізнаванням таблиць у Node.js, скануванням ділових документів та розпізнаванням тексту в складних умовах, таких як низьке освітлення чи спотворені зображення. Розробники також можуть розпізнавати текст у природних сценах, що робить його ідеальним для мобільних додатків, доповненої реальності та реального часу перекладу. Завдяки точному розпізнаванню та широким сценаріям використання Baidu-OCR-API є відмінним вибором для будь‑якого розробника, який прагне інтегрувати надійну OCR‑функціональність у Node.js‑застосунки.

Огляд

Огляд можливостей Baidu-OCR-API.

Features Overview

Виконувати OCR
Додати можливості OCR
Розпізнавати текст на зображеннях
Конвертувати зображення тексту
Розпізнавання шрифту тексту
Пошук PDF
Більше 100 мов
Створювати OCR додатки
Зберігати у браузері
Видобувати текст
Підтримка багатопоточності

Baidu-OCR-API

Baidu-OCR-API підтримує популярні формати файлів зображень, перелічені нижче.

Reader

PNG, JPEG, BMP, TIFF, TGA, DICOM

Writer

PNG, JPEG, BMP, TIFF

Baidu-OCR-API

Платформна незалежність

Baidu-OCR-API може працювати з будь‑якою Java‑базованою мовою програмування

Java

Baidu-OCR-API

Початок роботи з Baidu-OCR-API

Рекомендований спосіб встановлення Baidu-OCR-API — використання npm. Будь ласка, скористайтеся наведеною нижче командою для безпроблемної інсталяції

Встановити Baidu-OCR-API через npm

 npm install baidu-ocr-api -g

Ви також можете встановити його вручну; завантажте останні файли релізу безпосередньо з GitHub репозиторію.

Видобування тексту з зображень у Node.js‑додатках

Baidu-OCR-API спрощує процес завантаження та читання зображень і видобування тексту у Node.js‑застосунках. Функція загального розпізнавання тексту дозволяє розробникам завантажувати та видобувати друкований текст з зображень, що підходить для широкого спектра документів. API включає підтримку різних популярних форматів файлів зображень, таких як JPEG, PNG, GIF, TIFF, PDF, BMP тощо. Нижче наведено приклад, який показує, як розробники можуть завантажити зображення та виконати розпізнавання тексту у Node.js‑застосунках.

Як завантажити зображення та виконати розпізнавання тексту у Node.js‑додатках?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Розпізнавання форм і таблиць у Node.js‑додатках

Відкритий Baidu-OCR-API надає повний функціонал для розпізнавання форм і таблиць у Node.js‑застосунках. Щоб успішно виконати завдання, спочатку потрібно налаштувати клієнт Baidu OCR, використовуючи ваші API‑облікові дані. Потім напишіть код для читання зображення та виконання розпізнавання форм і таблиць. Ця функція особливо корисна для автоматизації видобування даних зі структурованих документів і підвищення продуктивності в різних застосунках. Нижче простий приклад, який демонструє, як розробник може прочитати зображення та виконати розпізнавання форм і таблиць у середовищі Node.js.

Як прочитати зображення та виконати розпізнавання форм і таблиць у Node.js‑додатках?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Розпізнавання рукописного тексту через Node.js API

Відкритий Baidu-OCR-API дуже простий у використанні та повністю здатний розпізнавати рукописний текст з високою точністю у Node.js‑застосунках. Для досягнення мети файл зображення читається та конвертується у рядок base64, після чого викликається метод handwriting з base64‑закодованим зображенням, а розпізнаний рукописний текст виводиться у консоль. Нижче наведено приклад, який демонструє, як розробники можуть виконати розпізнавання рукописного тексту, використовуючи відкритий Baidu OCR API у Node.js.

Як виконати розпізнавання рукописного тексту у Node.js‑додатках?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word