Безкоштовний Node.js API для додавання можливостей OCR у JS‑проекти.

Відкрита бібліотека OCR для Node.js, яка дозволяє програмістам розпізнавати та витягати текст з різних форматів файлів, включаючи зображення (JPEG, PNG), PDF та документи, безкоштовно, на багатьох мовах.

Що таке Node-Tesseract-OCR?

У сучасну цифрову епоху витяг тексту з зображень та документів став важливим завданням у різних галузях, включаючи управління документами, обробку даних та штучний інтелект. Технологія оптичного розпізнавання символів (OCR) дозволяє перетворювати скановані документи, зображення та PDF у редаговані текстові формати. Node-Tesseract-OCR — це відкритий API, який поєднує потужність OCR‑двигуна Tesseract, забезпечуючи безшовний та ефективний спосіб виконання OCR‑завдань у додатках Node.js.

Node-Tesseract-OCR — це обгортка Node.js для OCR‑двигуна Tesseract, яка дозволяє розробникам програмного забезпечення використовувати потужні можливості розпізнавання тексту Tesseract у середовищі Node.js. API підтримується у цьому репозиторії GitHub і пропонує широкий спектр функціональностей, що робить його придатним для різних випадків використання — від простого витягу тексту до більш складних завдань обробки документів. Розробники можуть витягати текст із зображень та документів кількома мовами, що робить його універсальним інструментом для різних застосувань.

API Node-Tesseract-OCR забезпечує розширені можливості обробки зображень, включаючи фільтрацію, зміну розмірів та кадрування, щоб гарантувати точність та надійність витягнутого тексту. Він підтримує понад 100 мов, що робить його універсальним рішенням для OCR‑завдань у різноманітних середовищах. Розробники можуть витягати текст із зображень, PDF та документів і повертати його у різних форматах, таких як JSON, XML та простий текст. API спроектовано легким, гнучким та простим у використанні, що робить його ідеальним вибором для розробників, які хочуть додати можливості OCR до своїх проєктів. Завдяки розширеним можливостям обробки зображень, підтримці мов та механізмам обробки помилок, це ідеальний вибір для розробників, які прагнуть інтегрувати OCR у свої проєкти.

Огляд

Огляд функцій Node-Tesseract-OCR.

Огляд функцій

Виконувати OCR
Додати можливості OCR
Розпізнавати текст на зображеннях
Конвертувати зображення тексту
Розпізнаний текст шрифту
Пошук у PDF
Понад 100 мов
Створювати OCR‑додатки
Зберігати у браузері
Витягувати текст
Підтримка багатопоточності

Node-Tesseract-OCR

Node-Tesseract-OCR підтримує популярні формати файлів зображень, перелічені нижче.

Читач

PNG, JPEG, BMP, TIFF, TGA, DICOM

Записувач

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

Платформна незалежність

Node-Tesseract-OCR може працювати з будь-якою Java‑базованою мовою програмування

Java

Node-Tesseract-OCR

Початок роботи з Node-Tesseract-OCR

Рекомендований спосіб встановлення Node-Tesseract-OCR — використання npm. Будь ласка, скористайтеся наступною командою для безперешкодного встановлення

Встановити Node-Tesseract-OCR через npm

npm install node-tesseract-ocr

Ви можете також встановити його вручну; завантажте останні файли релізу безпосередньо з репозиторію GitHub repository.

Витяг тексту з зображень у Node.js API

Відкрита бібліотека Node-Tesseract-OCR спрощує розробникам створення застосунків, які автоматично витягують текст із зображень у Node.js. Вона підтримує витяг тексту зі сканованих документів, PDF, фотографій з камери або фото чеків. Це може бути корисним для створення пошукових архівів, автоматизації вводу даних або обробки великого обсягу документів у таких галузях, як фінанси та охорона здоров’я. Ось простий приклад, який показує, як програмно витягати текст із зображень у Node.js.

Як витягнути текст із зображення у середовищі Node.js?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Краща попередня обробка зображень у Node.js

Попередня обробка зображень перед застосуванням OCR може значно підвищити точність розпізнавання тексту. Відкрита бібліотека Node-Tesseract-OCR дозволяє використовувати базові методи попередньої обробки, такі як зміна розмірів, бінаризація та випрямлення. Ці кроки можна реалізувати за допомогою додаткових бібліотек Node.js, таких як sharp або jimp, у поєднанні з Node-Tesseract-OCR. Нижче наведено приклад, який показує, як розробники використовують кроки попередньої обробки для покращення розпізнавання, особливо на зображеннях низької якості.

Як застосувати кроки попередньої обробки для покращення розпізнавання через Node.js API?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Розпізнаний текст на багатьох мовах

Однією з визначних особливостей Node-Tesseract-OCR є його широка підтримка багатьох мов. Бібліотека OCR Tesseract підтримує понад 100 мов, що робить її ідеальним вибором для застосунків, які потребують обробки документів різними мовами. Розробники можуть вказати мову(и), які Tesseract має використовувати, підвищуючи точність розпізнавання для текстів не англійською. Ось приклад, який показує, як розробники можуть розпізнавати текст французькою у Node.js застосунках.

Як розпізнати текст з зображення французькою через JavaScript API?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });