کتابخانه رایگان Node.js برای استخراج دادهها از اسناد اسکنشده
کتابخانه پیشرو منبع باز Node.js برای پردازش اسناد اسکنشده به شما امکان میدهد بهصورت کارآمد اسناد اسکنشده را بارگذاری، خواندن، پردازش و استخراج متن کنید در برنامههای Node.js.
DocumentVision چیست؟
در عصر دیجیتال امروز، مدیریت مؤثر اسناد برای سازمانهای مختلف از هر اندازهای حیاتی است. با افزایش حجم اسناد، حفظ یکپارچگی، امنیت و دسترسی آنها میتواند چالشبرانگیز باشد. اینجا جایگاه DocumentVision، یک کتابخانه منبع باز، به میان میآید. DV یک کتابخانه قدرتمند منبع باز است که برای توسعهدهندگان نرمافزاری که نیاز به کار با اسناد اسکنشده دارند طراحی شده است. این کتابخانه بر پایه Node.js ساخته شده و از چندین فناوری قوی از جمله Tesseract برای تشخیص نوری کاراکتر (OCR)، OpenCV برای پردازش تصویر و ZXing برای خواندن بارکد بهره میبرد. این ترکیب به توسعهدهندگان نرمافزار امکان میدهد برنامههایی بسازند که بتوانند بهصورت مؤثر وظایف مدیریت اسناد را انجام دهند.
DocumentVision یک کتابخانه Node.js است که مجموعهای جامع از ابزارها را برای خواندن و مدیریت اسناد اسکنشده در برنامههای Node.js فراهم میکند. این کتابخانه به توسعهدهندگان اجازه میدهد اسناد را بارگذاری، خواندن، بهروزرسانی، حذف یا استخراج متن یا تصاویر از آنها کنند، همچنین عملیات پیشرفتهای مانند جستجو، فیلتر کردن و مرتبسازی را فقط با چند خط کد انجام دهند. این کتابخانه بهگونهای طراحی شده است که انعطافپذیر و مقیاسپذیر باشد و برای طیف وسیعی از برنامهها، از سیستمهای مدیریت اسناد کوچک تا راهحلهای سازمانی بزرگ، مناسب باشد. برای توسعهدهندگان نرمافزار، این کتابخانه پیچیدگی کار با دادههای خام اسناد را انتزاع میکند و اجازه میدهد برنامههای سفارشی که اسناد اسکنشده را مدیریت میکنند، جریانهای کاری را خودکار میسازند یا اطلاعات مفید را از تصاویر استخراج کنند.
شروع کار با DocumentVision
برای نصب DocumentVision میتوانید از npm، مدیر بستههای JavaScript، استفاده کنید. لطفاً دستورات زیر را برای نصب موفق اجرا کنید.
نصب DocumentVision از طریق npm
$ npm install dv نصب DocumentVision از طریق GitHub
clone https://github.com/creatale/node-dv.gitبارگذاری و دستکاری تصویر با کتابخانه Node.js
کتابخانه منبع باز DocumentVision به توسعهدهندگان نرمافزار امکان انجام وظایف مختلف پردازش تصویر را از طریق یکپارچهسازی با OpenCV میدهد. این کتابخانه به توسعهدهندگان اجازه میدهد کیفیت تصویر را بهبود بخشند، ابعاد را تنظیم کنند یا حتی تصویر را پیشپردازش کنند تا نتایج OCR بهتری به دست آید. توسعهدهندگان میتوانند تصاویر را بارگذاری، تغییر اندازه، چرخاندن و تنظیم کنند تا کیفیت آنها را پیش از پردازش بهبود دهند. همچنین میتوانید اسناد اسکنشده و تصاویر را بارگذاری کرده و متن آن را در برنامههای Node.js استخراج کنید. در زیر مثالی آمده است که نشان میدهد چگونه توسعهدهندگان میتوانند اندازه تصویر را تغییر داده و آن را در برنامههای Node.js چرخانند.
چگونه تصویر را در برنامههای Node.js تغییر اندازه و چرخاند؟
const image = new dv.Image('path/to/image.png');
// Resize and rotate the image
image.resize(800, 600).rotate(90).save('path/to/output.png')
تشخیص نوری کاراکتر (OCR) در Node.js
DocumentVision موتور Tesseract را یکپارچه میکند و به کاربران اجازه میدهد متن را از اسناد اسکنشده یا تصاویر به فرمتهای قابل ویرایش داخل برنامههای Node.js تبدیل کنند. این ویژگی برای دیجیتالی کردن اسناد ضروری است و به توسعهدهندگان نرمافزار امکان میدهد متن چاپشده را از فایلهای تصویری مانند PDF یا JPEG اسکنشده استخراج کنند. مثال کد زیر نشان میدهد چگونه توسعهدهندگان میتوانند تصاویر PNG را بارگذاری و متن آن را در محیط Node.js استخراج کنند.
چگونه متن را از تصاویر PNG در برنامههای Node.js استخراج کنیم؟
const dv = require('node-dv');
const ocr = new dv.OCR();
ocr.recognize('path/to/image.png', (err, text) => {
if (err) {
console.error('OCR Error:', err);
} else {
console.log('Extracted Text:', text);
}
});
تشخیص و رمزگشایی بارکد در Node.js
خواندن بارکد یکی دیگر از ویژگیهای اساسی کتابخانه منبع باز DocumentVision است که با ادغام اسکنر بارکد ZXing امکانپذیر شده است. این قابلیت برای مدیریت اسنادی که شامل بارکد هستند، مانند برچسبهای حمل و نقل، فاکتورها یا برگههای اطلاعات محصول، مفید است. در زیر یک مثال ساده آورده شده که نشان میدهد چگونه توسعهدهندگان میتوانند تصویر بارکد را بارگذاری و در برنامههای Node.js رمزگشایی کنند.
چگونه تصاویر بارکد را در برنامههای Node.js بارگذاری و رمزگشایی کنیم؟
const barcode = new dv.Barcode();
barcode.decode('path/to/barcode.png', (err, result) => {
if (err) {
console.error('Barcode Error:', err);
} else {
console.log('Decoded Barcode:', result);
}
});
گردش کار قابلسفارشیسازی
DocumentVision یک پلتفرم قدرتمند و انعطافپذیر برای توسعهدهندگان فراهم میکند تا برنامههای سفارشی که با اسناد اسکنشده کار میکنند را بسازند. این کتابخانه امکان سفارشیسازی را فراهم میکند و به توسعهدهندگان اجازه میدهد خط لوله پردازش را مطابق نیازهای خاص خود تنظیم کنند. این انعطافپذیری میتواند به جریانهای کاری مؤثرتری که برای موارد استفاده خاص طراحی شدهاند، منجر شود.