کتابخانه روبی منبع باز برای تبدیل تصاویر به متن آنلاین
کتابخانه رایگان تشخیص کاراکتر نوری روبی (OCR) به توسعه دهندگان نرم افزار امکان بارگیری، خواندن و تبدیل تصاویر، PDF یا اسناد اسکن شده به متن یا اسناد قابل جستجو را می دهد.
فناوری تشخیص کاراکتر نوری (OCR) در سالهای اخیر پیشرفتهای چشمگیری داشته است و استخراج خودکار دادهها از منابع مختلف را آسانتر کرده است. اتوماسیون را فعال می کند، دسترسی به داده ها را بهبود می بخشد و بهره وری را در حوزه های مختلف افزایش می دهد. یکی از این ابزارهای قدرتمند، کتابخانه OcrSpace Ruby است که راه حل ساده ای را برای ادغام قابلیت های OCR در برنامه های روبی خود به توسعه دهندگان ارائه می دهد. این کتابخانه فرآیند استخراج متن از تصاویر، اسناد اسکن شده و فایلهای PDF را ساده میکند و آن را به انتخابی عالی برای توسعهدهندگانی که به دنبال راهحل مناسب OCR هستند تبدیل میکند.
کتابخانه OcrSpace Ruby یک رابط ساده و شهودی ارائه میدهد که ادغام قابلیتهای OCR را در برنامههای Ruby آسان میکند. چندین ویژگی مهم در کتابخانه وجود دارد، مانند بارگیری انواع مختلف تصاویر، استخراج متن از تصاویر، تبدیل اسناد اسکن شده به متن، استخراج متن از اسناد نوشته شده به زبان های مختلف، تشخیص متن از تصاویر با وضوح پایین، کار با محتوای دست نویس. ، بازیابی مختصات متن شناسایی شده، شناسایی شماره صفحه، شناسایی مناطق خاص مورد علاقه، و بسیاری موارد دیگر.
کتابخانه OcrSpace Ruby یک بسته بندی در اطراف Ocr.Space OCR API است که استخراج متن قابل اعتماد و دقیق از تصاویر و اسناد PDF را ارائه می دهد. این کتابخانه که به طور خاص برای توسعه دهندگان Ruby ساخته شده است، فرآیند یکپارچه سازی را ساده می کند و به برنامه نویسان اجازه می دهد تا به سرعت عملکرد OCR را بدون پرداختن به پیچیدگی های API اساسی در برنامه های خود وارد کنند. چه در حال ساختن یک سیستم مدیریت اسناد، یا استخراج خودکار دادهها یا افزایش قابلیت دسترسی باشید، کتابخانه OcrSpace Ruby ابزاری ارزشمند است که فرآیند OCR را ساده میکند و برنامههای شما را با قابلیتهای استخراج متن دقیق قدرتمند میکند.
شروع به کار با OcrSpace
روش توصیه شده برای نصب OcrSpace استفاده از Rubygems است. لطفا از دستور زیر برای نصب راحت استفاده کنید.
OcrSpace را از طریق Rubygems نصب کنید
$ gem install ocr_space
میتوانید کتابخانه مشترک کامپایلشده را از مخزن Github دانلود کنید.
تبدیل تصاویر از URL به متن از طریق Ruby API
کتابخانه متن باز OcrSpace دارای ویژگی های قدرتمندی برای بارگیری انواع مختلف تصاویر و تبدیل آنها به متن با چند خط کد روبی است. این کتابخانه از گزینه های مختلف OCR از جمله استخراج متن از تصاویر، اسناد اسکن شده و فایل های PDF پشتیبانی می کند. چه توسعهدهندگان نرمافزار نیاز به پردازش صورتحسابها، رسیدها یا هر نوع سند دیگری داشته باشند، کتابخانه OcrSpace Ruby میتواند آن را به طور موثر مدیریت کند. مثال زیر نشان می دهد که چگونه توسعه دهندگان نرم افزار می توانند تصاویر را از طریق URL با استفاده از Ruby API به متن تبدیل کنند.
تبدیل تصاویر از URL از طریق Ruby API
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
قابلیت های OCR پیشرفته از طریق Ruby API
کتابخانه متن باز OcrSpace دارای ویژگی های بسیار مفید و پیشرفته ای برای مدیریت عملیات OCR در برنامه های Ruby است. این می تواند متن را از تصاویر با وضوح پایین، متن تحریف شده و حتی محتوای دست نویس به دقت تشخیص دهد و از نتایج قابل اعتماد در سناریوهای مختلف اطمینان حاصل کند. جدا از استخراج متن، این کتابخانه همچنین به توسعه دهندگان اجازه می دهد تا اطلاعات مهم دیگری را از اسناد استخراج کنند. این شامل بازیابی مختصات متن شناسایی شده، شناسایی شماره صفحه، و شناسایی مناطق خاص مورد علاقه در سند است.
چگونه از طریق Ruby API متن را از فایل آپلود شده استخراج کنیم؟
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result