کتابخانه رایگان روبی پیشرفته برای بارگیری و استخراج متن از تصاویر
API و مبدل تصویر به متن Ruby OCR منبع باز پیشرو که به توسعه دهندگان نرم افزار اجازه می دهد تا متن را از تصاویر (تصاویر اسکن شده و فایل های PDF) بارگیری، شناسایی و استخراج کنند.
تشخیص کاراکتر نوری (OCR) یک فناوری قدرتمند است که رایانهها را قادر میسازد تا متن را از تصاویر یا اسناد اسکن شده شناسایی و استخراج کنند. کاربردهای متعددی دارد، از دیجیتالی کردن مواد چاپی گرفته تا خودکار کردن فرآیندهای ورود داده ها. در زبان برنامه نویسی Ruby، یکی از کتابخانه های محبوب برای OCR Ruby-Tesseract-OCR است. Ruby-Tesseract-OCR یک جواهر یاقوت است که به عنوان لفاف برای موتور Tesseract OCR عمل می کند. Tesseract یک موتور OCR منبع باز است که توسط Google توسعه یافته است و به دلیل دقت و پشتیبانی زبان مشهور است.
Ruby-Tesseract-OCR فراتر از قابلیت های اولیه OCR است و ویژگی های اضافی را برای موارد استفاده پیشرفته ارائه می دهد. به عنوان مثال، توسعه دهندگان نرم افزار می توانند یک منطقه مورد علاقه (ROI) را در یک تصویر مشخص کنند تا تجزیه و تحلیل OCR را به یک منطقه خاص محدود کنند. این به ویژه در هنگام برخورد با اسناد پیچیده یا زمانی که فقط نیاز به استخراج متن از یک بخش خاص دارید مفید است. این کتابخانه چندین ویژگی اضافی را برای افزایش قابلیت های OCR فراهم می کند، مانند بارگیری یک تصویر موجود، استخراج متن از تصاویر یا اسناد اسکن شده، دریافت خروجی HOCR (HTML OCR) و بسیاری موارد دیگر.
جواهر Ruby-Tesseract-OCR یک رابط کاربری آسان برای تعامل با موتور Tesseract فراهم می کند و به توسعه دهندگان Ruby این امکان را می دهد تا بدون زحمت قابلیت های OCR را در پروژه های خود ادغام کنند. خواه شما نیاز به استخراج اطلاعات از فاکتورها، دیجیتالی کردن مواد چاپی یا خودکار کردن وظایف ورود اطلاعات داشته باشید، کتابخانه منبع باز راه حل قابل اعتماد و کارآمدی را ارائه می دهد. آن را امتحان کنید و امروز پتانسیل OCR را در پروژه های Ruby خود باز کنید.
شروع به کار با Ruby-Tesseract-OCR
روش توصیه شده برای نصب Ruby-Tesseract-OCR استفاده از Rubygems است. لطفا از دستور زیر برای نصب راحت استفاده کنید.
Ruby-Tesseract-OCR را از طریق Rubygems نصب کنید
gem install tesseract-ocr
میتوانید کتابخانه مشترک کامپایلشده را از مخزن Github دانلود کنید.
استخراج متن از تصاویر و اسناد اسکن شده از طریق Ruby
Ruby-Tesseract-OCR یک کتابخانه منبع باز بسیار قدرتمند است که به توسعه دهندگان نرم افزار اجازه می دهد متن را از انواع مختلف تصاویر تنها با چند خط کد Ruby بارگیری و استخراج کنند. این کتابخانه استخراج متن از تصاویر، PDFS یا اسناد اسکن شده را آسان می کند. گردش کار معمولی شامل بارگذاری یک تصویر، پیکربندی پارامترهای OCR و فراخوانی موتور OCR برای تشخیص متن است. برای یک عملیات موفق، توسعهدهندگان باید مسیر تصویری را که میخواهند پردازش کنند ارائه کنند و متد text_for را برای استخراج متن فراخوانی کنند. در نهایت نتیجه روی کنسول چاپ خواهد شد. این کتابخانه گزینه های Fconfiguration مختلفی را برای کنترل رفتار OCR ارائه می دهد، مانند حالت تقسیم بندی صفحه، کاراکترهای لیست سفید و موارد دیگر. مثالهای زیر نشان میدهد که چگونه توسعهدهندگان نرمافزار میتوانند یک تصویر JPEG را بارگذاری کنند و متن را از داخل برنامههای Ruby استخراج کنند.
چگونه با استفاده از دستورات Ruby متن را از تصاویر استخراج کنیم؟
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
e.text_for('test/first.png').strip # => 'ABC'
استخراج متن از ناحیه تصویر خاص از طریق Ruby
کتابخانه منبع باز Ruby-Tesseract-OCR فراتر از قابلیت های اولیه OCR است و ویژگی های اضافی را برای موارد استفاده پیشرفته ارائه می دهد. به عنوان مثال، کاربران می توانند یک منطقه مورد علاقه (ROI) را در یک تصویر مشخص کنند تا تجزیه و تحلیل OCR را به یک منطقه خاص محدود کنند. این به ویژه در هنگام سر و کار داشتن با اسناد پیچیده یا زمانی که کاربران فقط نیاز به استخراج متن از یک بخش خاص دارند مفید است. علاوه بر این، کتابخانه روشهایی را برای به دست آوردن خروجی HOCR (HTML OCR) ارائه میکند که نه تنها متن شناسایی شده، بلکه اطلاعاتی در مورد چیدمان و مختصات عناصر متن را نیز شامل میشود. خروجی HOCR زمانی مفید است که به داده های گرانول بیشتری نیاز دارید یا می خواهید تجزیه و تحلیل بیشتری روی ساختار متن انجام دهید.
چگونه hOCR را روی یک تصویر از طریق Ruby Library انجام دهیم؟
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
puts e.hocr_for('test/first.png')