Безкоштовна бібліотека Node.js для отримання даних зі сканованого документа

Ведуча бібліотека Node.js з відкритим кодом для обробки сканованих документів дозволяє ефективно завантажувати, читати, обробляти та отримувати текст зі сканованих документів у Node.js‑додатках.

Що таке DocumentVision?

У сучасну цифрову еру ефективне управління документами має критичне значення для організацій будь‑якого розміру. Зі збільшенням обсягів документів складно підтримувати їхню цілісність, безпеку та доступність. Саме тут на допомогу приходить DocumentVision — бібліотека з відкритим кодом. DV — потужна бібліотека, створена для розробників, які працюють зі сканованими документами. Побудована на Node.js, вона використовує декілька надійних технологій, включаючи Tesseract для оптичного розпізнавання (OCR), OpenCV для обробки зображень та ZXing для зчитування штрих‑коду. Ця комбінація дозволяє створювати застосунки, які ефективно вирішують завдання управління документами.

DocumentVision — це бібліотека Node.js, яка забезпечує повний набір інструментів для читання та керування сканованими документами в Node.js‑застосунках. Вона дозволяє розробникам завантажувати, читати, оновлювати, видаляти або отримувати текст або зображення з документів, а також виконувати розширені операції, такі як пошук, фільтрація та сортування, лише кількома рядками коду. Бібліотека розроблена так, щоб бути гнучкою та масштабованою, що робить її придатною для широкого спектра застосунків — від маленьких систем управління документами до великих корпоративних рішень. Для розробників вона абстрагує складність роботи з сирими даними документів і надає можливість створювати кастомні застосунки, які обробляють скановані документи, автоматизують робочі процеси або отримують корисну інформацію зі зображень.

Previous Next

Початок роботи з DocumentVision

Для встановлення DocumentVision ви можете використати npm, менеджер пакетів для JavaScript. Будь ласка, використайте наступні команди для успішної інсталяції.

Встановити DocumentVision через npm

$ npm install dv  

Встановити DocumentVision через GitHub

clone https://github.com/creatale/node-dv.git

Завантаження та маніпулювання зображеннями за допомогою бібліотеки Node.js

Бібліотека DocumentVision з відкритим кодом дозволяє розробникам виконувати різноманітні задачі обробки зображень через інтеграцію з OpenCV. Вона забезпечує покращення якості зображень, зміну розмірів, а іноді й попередню обробку зображення для кращих результатів OCR. Розробники можуть завантажувати, змінювати розмір, обертати та коригувати зображення, підвищуючи їхню якість перед обробкою. Ви також можете завантажувати скановані документи разом із зображеннями і отримувати текст всередині Node.js‑застосунків. Ось приклад, що демонструє, як розробники можуть змінювати розмір і обертати зображення в Node.js‑застосунках.

Як змінити розмір та повернути зображення у Node.js‑застосунках?

const image = new dv.Image('path/to/image.png');
// Resize and rotate the image
image.resize(800, 600).rotate(90).save('path/to/output.png')

Оптичне розпізнавання символів (OCR) у Node.js

DocumentVision інтегрує движок Tesseract, який дозволяє користувачам перетворювати текст зі сканованих документів або зображень у редаговані формати в Node.js‑застосунках. Ця функція важлива для оцифрування документів, дозволяючи розробникам отримувати надрукований текст з файлів зображень, таких як PDF чи скановані JPEG. Наведений приклад коду показує, як розробники можуть завантажувати та отримувати текст з PNG‑зображень у середовищі Node.js.

Як отримати текст з PNG‑зображень у Node.js‑застосунках?

const dv = require('node-dv');
const ocr = new dv.OCR();

ocr.recognize('path/to/image.png', (err, text) => {
    if (err) {
        console.error('OCR Error:', err);
    } else {
        console.log('Extracted Text:', text);
    }
});

Виявлення та декодування штрих‑коду у Node.js

Зчитування штрих‑коду — ще одна важлива функція бібліотеки DocumentVision з відкритим кодом, реалізована завдяки інтеграції сканера штрих‑коду ZXing. Це корисно для управління документами, які містять штрих‑коди, наприклад, транспортні ярлики, рахунки‑фактури або листи з інформацією про продукт. Ось простий приклад, що демонструє, як розробники можуть завантажити зображення штрих‑коду та розшифрувати його в Node.js‑застосунках.

Як завантажити та декодувати зображення штрих‑коду у Node.js‑застосунках?

const barcode = new dv.Barcode();
barcode.decode('path/to/barcode.png', (err, result) => {
    if (err) {
        console.error('Barcode Error:', err);
    } else {
        console.log('Decoded Barcode:', result);
    }
}); 

Налаштовуваний робочий процес

DocumentVision пропонує потужну та гнучку платформу для розробників, дозволяючи створювати кастомні застосунки, що працюють зі сканованими документами. Бібліотека дозволяє налаштування, даючи змогу розробникам адаптувати конвеєр обробки під їхні конкретні вимоги. Така гнучкість може призвести до більш ефективних робочих процесів, пристосованих до конкретних випадків використання.

 Українська