Ruby библиотека с отворен код за конвертиране на изображения в текст онлайн
Безплатната библиотека за оптично разпознаване на символи (OCR) Ruby позволява на разработчиците на софтуер да зареждат, четат и конвертират изображения, PDF файлове или сканирани документи в текст или документи с възможност за търсене
Технологията за оптично разпознаване на символи (OCR) постигна значителен напредък през последните години, улеснявайки автоматизирането на извличането на данни от различни източници. Той позволява автоматизация, подобрява достъпността на данните и повишава производителността в различни области. Един такъв мощен инструмент е библиотеката OcrSpace Ruby, която предоставя на разработчиците лесно решение за интегриране на OCR възможности в техните Ruby приложения. Тази библиотека опростява процеса на извличане на текст от изображения, сканирани документи и PDF файлове, което я прави отличен избор за разработчици, които търсят удобно OCR решение.
Библиотеката OcrSpace Ruby предлага ясен и интуитивен интерфейс, което улеснява интегрирането на възможности за OCR в Ruby приложения. Има няколко важни функции част от библиотеката, като зареждане на различни видове изображения, извличане на текст от изображения, конвертиране на сканирани документи в текст, извличане на текст от документи, написани на множество езици, разпознаване на текст от изображения с ниска разделителна способност, работа с ръкописно съдържание , извличане на координати на разпознатия текст, откриване на номера на страници, идентифициране на конкретни области на интерес и много други.
Библиотеката OcrSpace Ruby е обвивка около OCR API на Ocr.Space, която предлага надеждно и точно извличане на текст от изображения и PDF документи. Създадена специално за разработчици на Ruby, тази библиотека опростява процеса на интегриране, позволявайки на програмистите бързо да включат OCR функционалност в своите приложения, без да се занимават със сложността на основния API. Независимо дали изграждате система за управление на документи, автоматизирате извличането на данни или подобрявате достъпността, библиотеката OcrSpace Ruby е безценен инструмент, който рационализира процеса на OCR и дава възможност на вашите приложения с точни възможности за извличане на текст.
Първи стъпки с OcrSpace
Препоръчителният начин за инсталиране на OcrSpace е използването на Rubygems. Моля, използвайте следната команда за гладка инсталация.
Инсталирайте OcrSpace чрез Rubygems
$ gem install ocr_space
Можете да изтеглите компилираната споделена библиотека от хранилището на Github.
Конвертиране на изображения от URL в текст чрез Ruby API
Библиотеката OcrSpace с отворен код включва някои мощни функции за зареждане на различни типове изображения и преобразуването им в текст с няколко реда Ruby код. Библиотеката поддържа различни опции за OCR, включително извличане на текст от изображения, сканирани документи и PDF файлове. Независимо дали разработчиците на софтуер трябва да обработват фактури, разписки или друг вид документ, библиотеката OcrSpace Ruby може да се справи ефективно с това. Следващият пример показва как разработчиците на софтуер могат да конвертират изображения в текст чрез URL чрез Ruby API.
Конвертиране на изображения от URL чрез Ruby API
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
Разширени възможности за OCR чрез Ruby API
Библиотеката OcrSpace с отворен код включва някои много полезни и разширени функции за обработка на OCR операции в Ruby приложения. Той може точно да разпознава текст от изображения с ниска разделителна способност, изкривен текст и дори ръкописно съдържание, като гарантира надеждни резултати в различни сценарии. Освен извличане на текст, библиотеката също така позволява на разработчиците да извличат друга важна информация от документи. Това включва извличане на координати на разпознатия текст, откриване на номера на страници и идентифициране на специфични области на интерес в документа.
Как да извлечете текст от качен файл чрез Ruby API?
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result