کتابخانه رایگان Node.js برای استخراج داده‌ها از اسناد اسکن‌شده

کتابخانه پیشرو منبع باز Node.js برای پردازش اسناد اسکن‌شده به شما امکان می‌دهد به‌صورت کارآمد اسناد اسکن‌شده را بارگذاری، خواندن، پردازش و استخراج متن کنید در برنامه‌های Node.js.

DocumentVision چیست؟

در عصر دیجیتال امروز، مدیریت مؤثر اسناد برای سازمان‌های مختلف از هر اندازه‌ای حیاتی است. با افزایش حجم اسناد، حفظ یکپارچگی، امنیت و دسترسی آن‌ها می‌تواند چالش‌برانگیز باشد. اینجا جایگاه DocumentVision، یک کتابخانه منبع باز، به میان می‌آید. DV یک کتابخانه قدرتمند منبع باز است که برای توسعه‌دهندگان نرم‌افزاری که نیاز به کار با اسناد اسکن‌شده دارند طراحی شده است. این کتابخانه بر پایه Node.js ساخته شده و از چندین فناوری قوی از جمله Tesseract برای تشخیص نوری کاراکتر (OCR)، OpenCV برای پردازش تصویر و ZXing برای خواندن بارکد بهره می‌برد. این ترکیب به توسعه‌دهندگان نرم‌افزار امکان می‌دهد برنامه‌هایی بسازند که بتوانند به‌صورت مؤثر وظایف مدیریت اسناد را انجام دهند.

DocumentVision یک کتابخانه Node.js است که مجموعه‌ای جامع از ابزارها را برای خواندن و مدیریت اسناد اسکن‌شده در برنامه‌های Node.js فراهم می‌کند. این کتابخانه به توسعه‌دهندگان اجازه می‌دهد اسناد را بارگذاری، خواندن، به‌روزرسانی، حذف یا استخراج متن یا تصاویر از آن‌ها کنند، همچنین عملیات پیشرفته‌ای مانند جستجو، فیلتر کردن و مرتب‌سازی را فقط با چند خط کد انجام دهند. این کتابخانه به‌گونه‌ای طراحی شده است که انعطاف‌پذیر و مقیاس‌پذیر باشد و برای طیف وسیعی از برنامه‌ها، از سیستم‌های مدیریت اسناد کوچک تا راه‌حل‌های سازمانی بزرگ، مناسب باشد. برای توسعه‌دهندگان نرم‌افزار، این کتابخانه پیچیدگی کار با داده‌های خام اسناد را انتزاع می‌کند و اجازه می‌دهد برنامه‌های سفارشی که اسناد اسکن‌شده را مدیریت می‌کنند، جریان‌های کاری را خودکار می‌سازند یا اطلاعات مفید را از تصاویر استخراج کنند.

Previous Next

شروع کار با DocumentVision

برای نصب DocumentVision می‌توانید از npm، مدیر بسته‌های JavaScript، استفاده کنید. لطفاً دستورات زیر را برای نصب موفق اجرا کنید.

نصب DocumentVision از طریق npm

$ npm install dv  

نصب DocumentVision از طریق GitHub

clone https://github.com/creatale/node-dv.git

بارگذاری و دستکاری تصویر با کتابخانه Node.js

کتابخانه منبع باز DocumentVision به توسعه‌دهندگان نرم‌افزار امکان انجام وظایف مختلف پردازش تصویر را از طریق یکپارچه‌سازی با OpenCV می‌دهد. این کتابخانه به توسعه‌دهندگان اجازه می‌دهد کیفیت تصویر را بهبود بخشند، ابعاد را تنظیم کنند یا حتی تصویر را پیش‌پردازش کنند تا نتایج OCR بهتری به دست آید. توسعه‌دهندگان می‌توانند تصاویر را بارگذاری، تغییر اندازه، چرخاندن و تنظیم کنند تا کیفیت آن‌ها را پیش از پردازش بهبود دهند. همچنین می‌توانید اسناد اسکن‌شده و تصاویر را بارگذاری کرده و متن آن را در برنامه‌های Node.js استخراج کنید. در زیر مثالی آمده است که نشان می‌دهد چگونه توسعه‌دهندگان می‌توانند اندازه تصویر را تغییر داده و آن را در برنامه‌های Node.js چرخانند.

چگونه تصویر را در برنامه‌های Node.js تغییر اندازه و چرخاند؟

const image = new dv.Image('path/to/image.png');
// Resize and rotate the image
image.resize(800, 600).rotate(90).save('path/to/output.png')

تشخیص نوری کاراکتر (OCR) در Node.js

DocumentVision موتور Tesseract را یکپارچه می‌کند و به کاربران اجازه می‌دهد متن را از اسناد اسکن‌شده یا تصاویر به فرمت‌های قابل ویرایش داخل برنامه‌های Node.js تبدیل کنند. این ویژگی برای دیجیتالی کردن اسناد ضروری است و به توسعه‌دهندگان نرم‌افزار امکان می‌دهد متن چاپ‌شده را از فایل‌های تصویری مانند PDF یا JPEG اسکن‌شده استخراج کنند. مثال کد زیر نشان می‌دهد چگونه توسعه‌دهندگان می‌توانند تصاویر PNG را بارگذاری و متن آن را در محیط Node.js استخراج کنند.

چگونه متن را از تصاویر PNG در برنامه‌های Node.js استخراج کنیم؟

const dv = require('node-dv');
const ocr = new dv.OCR();

ocr.recognize('path/to/image.png', (err, text) => {
    if (err) {
        console.error('OCR Error:', err);
    } else {
        console.log('Extracted Text:', text);
    }
});

تشخیص و رمزگشایی بارکد در Node.js

خواندن بارکد یکی دیگر از ویژگی‌های اساسی کتابخانه منبع باز DocumentVision است که با ادغام اسکنر بارکد ZXing امکان‌پذیر شده است. این قابلیت برای مدیریت اسنادی که شامل بارکد هستند، مانند برچسب‌های حمل و نقل، فاکتورها یا برگه‌های اطلاعات محصول، مفید است. در زیر یک مثال ساده آورده شده که نشان می‌دهد چگونه توسعه‌دهندگان می‌توانند تصویر بارکد را بارگذاری و در برنامه‌های Node.js رمزگشایی کنند.

چگونه تصاویر بارکد را در برنامه‌های Node.js بارگذاری و رمزگشایی کنیم؟

const barcode = new dv.Barcode();
barcode.decode('path/to/barcode.png', (err, result) => {
    if (err) {
        console.error('Barcode Error:', err);
    } else {
        console.log('Decoded Barcode:', result);
    }
}); 

گردش کار قابل‌سفارشی‌سازی

DocumentVision یک پلتفرم قدرتمند و انعطاف‌پذیر برای توسعه‌دهندگان فراهم می‌کند تا برنامه‌های سفارشی که با اسناد اسکن‌شده کار می‌کنند را بسازند. این کتابخانه امکان سفارشی‌سازی را فراهم می‌کند و به توسعه‌دهندگان اجازه می‌دهد خط لوله پردازش را مطابق نیازهای خاص خود تنظیم کنند. این انعطاف‌پذیری می‌تواند به جریان‌های کاری مؤثرتری که برای موارد استفاده خاص طراحی شده‌اند، منجر شود.

 فارسی