کتابخانه رایگان روبی پیشرفته برای بارگیری و استخراج متن از تصاویر

API و مبدل تصویر به متن Ruby OCR منبع باز پیشرو که به توسعه دهندگان نرم افزار اجازه می دهد تا متن را از تصاویر (تصاویر اسکن شده و فایل های PDF) بارگیری، شناسایی و استخراج کنند.

تشخیص کاراکتر نوری (OCR) یک فناوری قدرتمند است که رایانه‌ها را قادر می‌سازد تا متن را از تصاویر یا اسناد اسکن شده شناسایی و استخراج کنند. کاربردهای متعددی دارد، از دیجیتالی کردن مواد چاپی گرفته تا خودکار کردن فرآیندهای ورود داده ها. در زبان برنامه نویسی Ruby، یکی از کتابخانه های محبوب برای OCR Ruby-Tesseract-OCR است. Ruby-Tesseract-OCR یک جواهر یاقوت است که به عنوان لفاف برای موتور Tesseract OCR عمل می کند. Tesseract یک موتور OCR منبع باز است که توسط Google توسعه یافته است و به دلیل دقت و پشتیبانی زبان مشهور است.

Ruby-Tesseract-OCR فراتر از قابلیت های اولیه OCR است و ویژگی های اضافی را برای موارد استفاده پیشرفته ارائه می دهد. به عنوان مثال، توسعه دهندگان نرم افزار می توانند یک منطقه مورد علاقه (ROI) را در یک تصویر مشخص کنند تا تجزیه و تحلیل OCR را به یک منطقه خاص محدود کنند. این به ویژه در هنگام برخورد با اسناد پیچیده یا زمانی که فقط نیاز به استخراج متن از یک بخش خاص دارید مفید است. این کتابخانه چندین ویژگی اضافی را برای افزایش قابلیت های OCR فراهم می کند، مانند بارگیری یک تصویر موجود، استخراج متن از تصاویر یا اسناد اسکن شده، دریافت خروجی HOCR (HTML OCR) و بسیاری موارد دیگر.

جواهر Ruby-Tesseract-OCR یک رابط کاربری آسان برای تعامل با موتور Tesseract فراهم می کند و به توسعه دهندگان Ruby این امکان را می دهد تا بدون زحمت قابلیت های OCR را در پروژه های خود ادغام کنند. خواه شما نیاز به استخراج اطلاعات از فاکتورها، دیجیتالی کردن مواد چاپی یا خودکار کردن وظایف ورود اطلاعات داشته باشید، کتابخانه منبع باز راه حل قابل اعتماد و کارآمدی را ارائه می دهد. آن را امتحان کنید و امروز پتانسیل OCR را در پروژه های Ruby خود باز کنید.

در یک نگاه

مروری از ویژگی‌های Ruby-Tesseract-OCR.

بررسی اجمالی ویژگی ها

OCR را انجام دهید
افزودن قابلیت های OCR
تشخیص متن تصویر
بارگیری تصاویر از طریق URL
تبدیل متن PDF tp
متن قلم شناسایی شده
جستجوی PDF
زبان های دیگر
برنامه های OCR ایجاد کنید
ذخیره در مرورگر
متن را استخراج کنید
پشتیبانی از چند رشته

Ruby-Tesseract-OCR

Ruby-Tesseract-OCR از فرمت‌های فایل OCR معروف فهرست شده در زیر پشتیبانی می‌کند.

خواننده

PNG, JPEG, BMP, TIFF, TGA, DICOM

نویسنده

PNG, JPEG, BMP, TIFF

Ruby-Tesseract-OCR

استقلال پلتفرم

Ruby-Tesseract-OCR فقط به Ruby Runtime نیاز دارد.

Ruby 5.1 و بالاتر.

Ruby-Tesseract-OCR

شروع به کار با Ruby-Tesseract-OCR

روش توصیه شده برای نصب Ruby-Tesseract-OCR استفاده از Rubygems است. لطفا از دستور زیر برای نصب راحت استفاده کنید.

Ruby-Tesseract-OCR را از طریق Rubygems نصب کنید

gem install tesseract-ocr

می‌توانید کتابخانه مشترک کامپایل‌شده را از مخزن Github دانلود کنید.

استخراج متن از تصاویر و اسناد اسکن شده از طریق Ruby

Ruby-Tesseract-OCR یک کتابخانه منبع باز بسیار قدرتمند است که به توسعه دهندگان نرم افزار اجازه می دهد متن را از انواع مختلف تصاویر تنها با چند خط کد Ruby بارگیری و استخراج کنند. این کتابخانه استخراج متن از تصاویر، PDFS یا اسناد اسکن شده را آسان می کند. گردش کار معمولی شامل بارگذاری یک تصویر، پیکربندی پارامترهای OCR و فراخوانی موتور OCR برای تشخیص متن است. برای یک عملیات موفق، توسعه‌دهندگان باید مسیر تصویری را که می‌خواهند پردازش کنند ارائه کنند و متد text_for را برای استخراج متن فراخوانی کنند. در نهایت نتیجه روی کنسول چاپ خواهد شد. این کتابخانه گزینه های Fconfiguration مختلفی را برای کنترل رفتار OCR ارائه می دهد، مانند حالت تقسیم بندی صفحه، کاراکترهای لیست سفید و موارد دیگر. مثال‌های زیر نشان می‌دهد که چگونه توسعه‌دهندگان نرم‌افزار می‌توانند یک تصویر JPEG را بارگذاری کنند و متن را از داخل برنامه‌های Ruby استخراج کنند.

چگونه با استفاده از دستورات Ruby متن را از تصاویر استخراج کنیم؟

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

استخراج متن از ناحیه تصویر خاص از طریق Ruby

کتابخانه منبع باز Ruby-Tesseract-OCR فراتر از قابلیت های اولیه OCR است و ویژگی های اضافی را برای موارد استفاده پیشرفته ارائه می دهد. به عنوان مثال، کاربران می توانند یک منطقه مورد علاقه (ROI) را در یک تصویر مشخص کنند تا تجزیه و تحلیل OCR را به یک منطقه خاص محدود کنند. این به ویژه در هنگام سر و کار داشتن با اسناد پیچیده یا زمانی که کاربران فقط نیاز به استخراج متن از یک بخش خاص دارند مفید است. علاوه بر این، کتابخانه روش‌هایی را برای به دست آوردن خروجی HOCR (HTML OCR) ارائه می‌کند که نه تنها متن شناسایی شده، بلکه اطلاعاتی در مورد چیدمان و مختصات عناصر متن را نیز شامل می‌شود. خروجی HOCR زمانی مفید است که به داده های گرانول بیشتری نیاز دارید یا می خواهید تجزیه و تحلیل بیشتری روی ساختار متن انجام دهید.

چگونه hOCR را روی یک تصویر از طریق Ruby Library انجام دهیم؟

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')