API جاوا اسکریپت منبع باز برای افزودن و مدیریت OCR به برنامه های وب
یک کتابخانه رایگان جاوا اسکریپت برای افزودن قابلیت تشخیص کاراکتر نوری (OCR) به برنامه های وب JS و تبدیل تصاویر متن چاپ شده یا دست نویس به متن قابل خواندن توسط ماشین به صورت رایگان.
Tesseract.js یک کتابخانه جاوا اسکریپت منبع باز بسیار مفید است که توسعه دهندگان نرم افزار را قادر می سازد تا با حداقل تلاش و هزینه، قابلیت تشخیص کاراکتر نوری (OCR) را در داخل برنامه های وب خود ادغام کنند. OCR فرآیند تبدیل تصاویر متن چاپ شده یا دست نویس به متن قابل خواندن توسط ماشین است. Tesseract.js درگاهی از موتور محبوب Tesseract OCR است که در ابتدا توسط Hewlett-Packard در دهه 1980 توسعه یافت و بعداً توسط Google نگهداری شد. Tesseract.js می تواند بیش از 100 زبان را تشخیص دهد و آن را به ابزاری قدرتمند برای توسعه دهندگانی تبدیل می کند که به دنبال افزودن قابلیت OCR به برنامه های وب خود هستند.
کار با Tesseract.js بسیار آسان است و میتوان از آن برای کارهای مختلفی مانند استخراج متن از اسناد اسکن شده، رسیدها و کارتهای ویزیت، خودکار کردن وظایف ورود دادهها و همچنین بهبود عملکرد جستجو در برنامههای وب استفاده کرد. یکی از مزایای کلیدی Tesseract.js توانایی آن در تشخیص متن است حتی زمانی که تصویر ورودی کیفیت یا وضوح پایینی دارد. این کتابخانه از الگوریتم های یادگیری ماشین برای بهبود دقت نتایج OCR استفاده می کند. همچنین می تواند تجزیه و تحلیل طرح بندی صفحه را انجام دهد و مناطق مورد علاقه را در یک تصویر تشخیص دهد.
Tesseract.js به دلیل سهولت استفاده و همچنین قابلیتهای قدرتمند OCR محبوبیت پیدا میکند و میتواند به راحتی در مرورگر یا سرور با NodeJS اجرا شود. این یک API ساده ارائه می دهد که به توسعه دهندگان نرم افزار اجازه می دهد تا گزینه های OCR مانند زبان، حالت بخش بندی صفحه و کاراکترهای لیست سفید را پیکربندی کنند. توانایی آن در تشخیص متن از تصاویر بی کیفیت و پشتیبانی از چندین زبان، آن را به ابزاری ارزشمند برای طیف وسیعی از برنامهها و انتخابی عالی برای توسعهدهندگانی که به دنبال اضافه کردن OCR به برنامههای وب خود هستند تبدیل میکند.
شروع به کار با Tesseract.js
روش توصیه شده برای نصب Tesseract.js استفاده از npm است. لطفا از دستور زیر برای نصب راحت
استفاده کنیدTesseract.jsvia npm را نصب کنید
npm install tesseract.js
همچنین می توانید آن را به صورت دستی نصب کنید. آخرین فایل های نسخه را مستقیماً از مخزن GitHub دانلود کنید.
تبدیل تصویر به متن از طریق JavaScript API
کتابخانه منبع باز جاوا اسکریپت Tesseract.js کار با انواع مختلف تصاویر مانند BMP، JPG، PNG، PBM، WebP و شاید بیشتر را برای توسعه دهندگان نرم افزار آسان می کند. این کتابخانه از استخراج متن از تصاویر برای پردازش خودکار متون روی تصاویر، PDF و اسناد اسکن شده پشتیبانی می کند. مثال زیر نحوه بارگذاری یک تصویر و استخراج متن از آن را تنها با چند خط کد نشان می دهد. آرگومان زبان برای تعیین داده های زبان آموزش دیده برای استفاده در پردازش تصاویر استفاده می شود. توسعه دهندگان نرم افزار می توانند از چندین زبان در اینجا استفاده کنند.
چگونه با استفاده از JavaScript API تصویر را به متن تبدیل کنیم؟
Tesseract.recognize(
image,language,
{
logger: m => console.log(m)
}
)
.catch (err => {
console.error(err);
})
.then(result => {
console.log(result);
})
}
خواندن منطقه تصویر و استخراج متن از طریق JS API
کتابخانه منبع باز جاوا اسکریپت دارای ویژگی های بسیار مفیدی برای خواندن یک ناحیه خاص در داخل یک تصویر و ضبط داده های آن در برنامه های جاوا اسکریپت است. API از گرفتن ناحیه تصویر پشتیبانی می کند و سعی می کند متن داخل این ناحیه را با استفاده از موتور قدرتمند OCR داخلی تشخیص دهد. مثالهای زیر نشان میدهند که چگونه توسعهدهندگان نرمافزار میتوانند URL را به تصویر ارائه دهند و API به راحتی میتواند متن را در ناحیه انتخابشده شناسایی و تشخیص دهد.
خواندن و تشخیص متن در یک منطقه انتخابی از یک تصویر از طریق JS API
const { createWorker } = require('tesseract.js');
const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };
(async () => {
await worker.loadLanguage('eng');
await worker.initialize('eng');
const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
console.log(text);
await worker.terminate();
})();