Безкоштовний Node.js API для розпізнавання та витягування тексту з зображень

Безкоштовний Node.js — провідний Node.js API, який забезпечує високу точність розпізнавання тексту на багатьох мовах та різноманітних шрифтах і макетах.

У сучасному світі розробки, орієнтованої на ШІ, оптичне розпізнавання символів (OCR) стало необхідним для автоматизації витягування тексту з зображень і документів. Розробники, які прагнуть створювати OCR у Node.js, можуть значно виграти від Baidu-OCR-API — потужного інструменту, який підтримує витягування тексту з зображень, розпізнавання рукописного тексту та навіть складні завдання, такі як розпізнавання форм у додатках Node.js. Будь то сканування рахунків, оцифрування документів або забезпечення функцій доступності, ця бібліотека OCR для Node.js пропонує високу продуктивність і легко інтегрується в сучасні застосунки.

Baidu-OCR-API — безкоштовний Node.js OCR API, який використовує глибоке навчання для розпізнавання друкованого та рукописного тексту на багатьох мовах, включаючи китайську, англійську, японську тощо. Він відмінно справляється з розпізнаванням таблиць у Node.js, скануванням ділових документів і розпізнаванням тексту в складних умовах, таких як низьке освітлення чи спотворені зображення. Розробники також можуть розпізнавати текст у природних сценах, що робить його ідеальним для мобільних додатків, доповненої реальності та використання в реальному часі для перекладу. Завдяки точному розпізнаванню та універсальним сценаріям використання Baidu-OCR-API є відмінним вибором для будь‑якого розробника, який хоче інтегрувати надійний OCR у свої Node.js застосунки.

Огляд

Огляд функцій Baidu-OCR-API.

Огляд функцій

Виконання OCR
Додавання можливостей OCR
Розпізнавання тексту на зображенні
Конвертація зображень з текстом
Розпізнаний шрифтовий текст
Пошук PDF
Понад 100 мов
Створення OCR додатків
Збереження в браузері
Витяг тексту
Підтримка багатопоточності

Baidu-OCR-API

Baidu-OCR-API підтримує популярні формати файлів зображень, перелічені нижче.

Читач

PNG, JPEG, BMP, TIFF, TGA, DICOM

Записувач

PNG, JPEG, BMP, TIFF

Baidu-OCR-API

Платформна незалежність

Baidu-OCR-API може працювати з будь-якою мовою програмування на базі Java

Java

Baidu-OCR-API

Початок роботи з Baidu-OCR-API

Рекомендований спосіб встановлення Baidu-OCR-API — використання npm. Будь ласка, скористайтеся наведеною нижче командою для безпроблемної інсталяції

Встановити Baidu-OCR-API через npm

 npm install baidu-ocr-api -g

Ви також можете встановити його вручну; завантажте останні файли релізу безпосередньо з GitHub репозиторію.

Витяг тексту з зображень у додатках Node.js

Baidu-OCR-API спрощує процес завантаження та читання зображень і витягування тексту у додатках Node.js. Функція загального розпізнавання тексту дозволяє розробникам завантажувати та витягувати друкований текст з зображень, що підходить для широкого спектра документів. API включає підтримку різних популярних форматів файлів зображень, таких як JPEG, PNG, GIF, TIFF, PDF, BMP та багато інших. Нижче наведено приклад, який показує, як розробники можуть завантажити зображення та виконати розпізнавання тексту в Node.js.

Як завантажити та виконати розпізнавання тексту на зображенні у додатках Node.js?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Розпізнавання форм і таблиць у додатках Node.js

Відкритий Baidu-OCR-API надає повний функціонал для розпізнавання форм і таблиць у додатках Node.js. Щоб успішно виконати завдання, спочатку потрібно налаштувати клієнт Baidu OCR, використовуючи ваші облікові дані API. Потім напишіть код для читання зображення та виконання розпізнавання форм і таблиць. Ця функція особливо корисна для автоматизації витягування даних зі структурованих документів і підвищення продуктивності в різних застосунках. Нижче простий приклад, який демонструє, як розробник може читати зображення та виконувати розпізнавання форм і таблиць у середовищі Node.js.

Як прочитати зображення та виконати розпізнавання форм і таблиць у додатках Node.js?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Розпізнавання рукописного тексту через Node.js API

Відкритий Baidu-OCR-API дуже простий у використанні та повністю здатний розпізнавати рукописний текст з високою точністю у додатках Node.js. Щоб досягти мети, файл зображення читається та конвертується у рядок base64, після чого викликається метод handwriting з base64‑закодованим зображенням, і розпізнаний рукописний текст виводиться у консоль. Нижче наведено приклад, який демонструє, як розробники можуть виконувати розпізнавання рукописного тексту, використовуючи відкритий Baidu OCR API у Node.js.

Як виконати розпізнавання рукописного тексту у додатках Node.js?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word