1. محصولات
  2.   OCR
  3.   JavaScript
  4.   Tesseract.js
 
  

API جاوا اسکریپت منبع باز برای افزودن و مدیریت OCR به برنامه های وب

یک کتابخانه رایگان جاوا اسکریپت برای افزودن قابلیت تشخیص کاراکتر نوری (OCR) به برنامه های وب JS و تبدیل تصاویر متن چاپ شده یا دست نویس به متن قابل خواندن توسط ماشین به صورت رایگان.

Tesseract.js یک کتابخانه جاوا اسکریپت منبع باز بسیار مفید است که توسعه دهندگان نرم افزار را قادر می سازد تا با حداقل تلاش و هزینه، قابلیت تشخیص کاراکتر نوری (OCR) را در داخل برنامه های وب خود ادغام کنند. OCR فرآیند تبدیل تصاویر متن چاپ شده یا دست نویس به متن قابل خواندن توسط ماشین است. Tesseract.js درگاهی از موتور محبوب Tesseract OCR است که در ابتدا توسط Hewlett-Packard در دهه 1980 توسعه یافت و بعداً توسط Google نگهداری شد. Tesseract.js می تواند بیش از 100 زبان را تشخیص دهد و آن را به ابزاری قدرتمند برای توسعه دهندگانی تبدیل می کند که به دنبال افزودن قابلیت OCR به برنامه های وب خود هستند.

کار با Tesseract.js بسیار آسان است و می‌توان از آن برای کارهای مختلفی مانند استخراج متن از اسناد اسکن شده، رسیدها و کارت‌های ویزیت، خودکار کردن وظایف ورود داده‌ها و همچنین بهبود عملکرد جستجو در برنامه‌های وب استفاده کرد. یکی از مزایای کلیدی Tesseract.js توانایی آن در تشخیص متن است حتی زمانی که تصویر ورودی کیفیت یا وضوح پایینی دارد. این کتابخانه از الگوریتم های یادگیری ماشین برای بهبود دقت نتایج OCR استفاده می کند. همچنین می تواند تجزیه و تحلیل طرح بندی صفحه را انجام دهد و مناطق مورد علاقه را در یک تصویر تشخیص دهد.

Tesseract.js به دلیل سهولت استفاده و همچنین قابلیت‌های قدرتمند OCR محبوبیت پیدا می‌کند و می‌تواند به راحتی در مرورگر یا سرور با NodeJS اجرا شود. این یک API ساده ارائه می دهد که به توسعه دهندگان نرم افزار اجازه می دهد تا گزینه های OCR مانند زبان، حالت بخش بندی صفحه و کاراکترهای لیست سفید را پیکربندی کنند. توانایی آن در تشخیص متن از تصاویر بی کیفیت و پشتیبانی از چندین زبان، آن را به ابزاری ارزشمند برای طیف وسیعی از برنامه‌ها و انتخابی عالی برای توسعه‌دهندگانی که به دنبال اضافه کردن OCR به برنامه‌های وب خود هستند تبدیل می‌کند.

Previous Next

شروع به کار با Tesseract.js

روش توصیه شده برای نصب Tesseract.js استفاده از npm است. لطفا از دستور زیر برای نصب راحت

استفاده کنید

Tesseract.jsvia npm را نصب کنید

 npm install tesseract.js

همچنین می توانید آن را به صورت دستی نصب کنید. آخرین فایل های نسخه را مستقیماً از مخزن GitHub دانلود کنید.

تبدیل تصویر به متن از طریق JavaScript API

کتابخانه منبع باز جاوا اسکریپت Tesseract.js کار با انواع مختلف تصاویر مانند BMP، JPG، PNG، PBM، WebP و شاید بیشتر را برای توسعه دهندگان نرم افزار آسان می کند. این کتابخانه از استخراج متن از تصاویر برای پردازش خودکار متون روی تصاویر، PDF و اسناد اسکن شده پشتیبانی می کند. مثال زیر نحوه بارگذاری یک تصویر و استخراج متن از آن را تنها با چند خط کد نشان می دهد. آرگومان زبان برای تعیین داده های زبان آموزش دیده برای استفاده در پردازش تصاویر استفاده می شود. توسعه دهندگان نرم افزار می توانند از چندین زبان در اینجا استفاده کنند.

چگونه با استفاده از JavaScript API تصویر را به متن تبدیل کنیم؟

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

خواندن منطقه تصویر و استخراج متن از طریق JS API

کتابخانه منبع باز جاوا اسکریپت دارای ویژگی های بسیار مفیدی برای خواندن یک ناحیه خاص در داخل یک تصویر و ضبط داده های آن در برنامه های جاوا اسکریپت است. API از گرفتن ناحیه تصویر پشتیبانی می کند و سعی می کند متن داخل این ناحیه را با استفاده از موتور قدرتمند OCR داخلی تشخیص دهد. مثال‌های زیر نشان می‌دهند که چگونه توسعه‌دهندگان نرم‌افزار می‌توانند URL را به تصویر ارائه دهند و API به راحتی می‌تواند متن را در ناحیه انتخاب‌شده شناسایی و تشخیص دهد.

خواندن و تشخیص متن در یک منطقه انتخابی از یک تصویر از طریق JS API

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();
 فارسی