Библиотека Ruby с открытым исходным кодом для преобразования изображений в текст онлайн
Бесплатная библиотека Ruby оптического распознавания символов (OCR) позволяет разработчикам программного обеспечения загружать, читать и конвертировать изображения, PDF-файлы или отсканированные документы в текст или документы с возможностью поиска.
За последние годы технология оптического распознавания символов (OCR) значительно продвинулась вперед, упростив автоматизацию извлечения данных из различных источников. Это обеспечивает автоматизацию, улучшает доступность данных и повышает производительность в различных областях. Одним из таких мощных инструментов является библиотека OcrSpace Ruby, которая предоставляет разработчикам простое решение для интеграции возможностей OCR в их приложения Ruby. Эта библиотека упрощает процесс извлечения текста из изображений, отсканированных документов и файлов PDF, что делает ее отличным выбором для разработчиков, которым требуется удобное решение для оптического распознавания символов.
Библиотека OcrSpace Ruby предлагает простой и интуитивно понятный интерфейс, позволяющий легко интегрировать возможности OCR в приложения Ruby. В библиотеке есть несколько важных функций, таких как загрузка различных типов изображений, извлечение текста из изображений, преобразование отсканированных документов в текст, извлечение текста из документов, написанных на нескольких языках, распознавание текста из изображений с низким разрешением, работа с рукописным содержимым. , получение координат распознанного текста, определение номеров страниц, определение конкретных областей интереса и многое другое.
Библиотека OcrSpace Ruby представляет собой оболочку API Ocr.Space OCR, которая обеспечивает надежное и точное извлечение текста из изображений и PDF-документов. Эта библиотека, созданная специально для разработчиков Ruby, упрощает процесс интеграции, позволяя программистам быстро включать функции OCR в свои приложения, не сталкиваясь со сложностями базового API. Независимо от того, создаете ли вы систему управления документами, автоматизируете извлечение данных или повышаете доступность, библиотека OcrSpace Ruby — это бесценный инструмент, который оптимизирует процесс оптического распознавания символов и расширяет возможности ваших приложений с возможностью точного извлечения текста.
Начало работы с OcrSpace
Рекомендуемый способ установки OcrSpace — использование Rubygems. Пожалуйста, используйте следующую команду для плавной установки.
Установите OcrSpace через Rubygems
$ gem install ocr_space
Вы можете загрузить скомпилированную общую библиотеку из репозитория Github.
Преобразование изображений из URL в текст через Ruby API
Библиотека OcrSpace с открытым исходным кодом включает в себя несколько мощных функций для загрузки различных типов изображений и преобразования их в текст с помощью пары строк кода Ruby. Библиотека поддерживает различные варианты оптического распознавания символов, включая извлечение текста из изображений, отсканированных документов и файлов PDF. Если разработчикам программного обеспечения необходимо обрабатывать счета-фактуры, квитанции или любые другие типы документов, библиотека OcrSpace Ruby может эффективно справиться с этим. В следующем примере показано, как разработчики программного обеспечения могут преобразовывать изображения в текст через URL-адрес с помощью Ruby API.
Конвертируйте изображения из URL-адреса через Ruby API
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
Расширенные возможности оптического распознавания символов через Ruby API
Библиотека OcrSpace с открытым исходным кодом включает в себя несколько очень полезных и расширенных функций для обработки операций OCR внутри приложений Ruby. Он может точно распознавать текст на изображениях с низким разрешением, искаженный текст и даже рукописный контент, обеспечивая надежные результаты в различных сценариях. Помимо извлечения текста, библиотека также позволяет разработчикам извлекать другую важную информацию из документов. Это включает в себя извлечение координат распознанного текста, определение номеров страниц и выявление конкретных областей интереса в документе.
Как извлечь текст из загруженного файла с помощью Ruby API?
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result