Библиотека Ruby с открытым исходным кодом для преобразования изображений в текст онлайн

Бесплатная библиотека Ruby оптического распознавания символов (OCR) позволяет разработчикам программного обеспечения загружать, читать и конвертировать изображения, PDF-файлы или отсканированные документы в текст или документы с возможностью поиска.

За последние годы технология оптического распознавания символов (OCR) значительно продвинулась вперед, упростив автоматизацию извлечения данных из различных источников. Это обеспечивает автоматизацию, улучшает доступность данных и повышает производительность в различных областях. Одним из таких мощных инструментов является библиотека OcrSpace Ruby, которая предоставляет разработчикам простое решение для интеграции возможностей OCR в их приложения Ruby. Эта библиотека упрощает процесс извлечения текста из изображений, отсканированных документов и файлов PDF, что делает ее отличным выбором для разработчиков, которым требуется удобное решение для оптического распознавания символов.

Библиотека OcrSpace Ruby предлагает простой и интуитивно понятный интерфейс, позволяющий легко интегрировать возможности OCR в приложения Ruby. В библиотеке есть несколько важных функций, таких как загрузка различных типов изображений, извлечение текста из изображений, преобразование отсканированных документов в текст, извлечение текста из документов, написанных на нескольких языках, распознавание текста из изображений с низким разрешением, работа с рукописным содержимым. , получение координат распознанного текста, определение номеров страниц, определение конкретных областей интереса и многое другое.

Библиотека OcrSpace Ruby представляет собой оболочку API Ocr.Space OCR, которая обеспечивает надежное и точное извлечение текста из изображений и PDF-документов. Эта библиотека, созданная специально для разработчиков Ruby, упрощает процесс интеграции, позволяя программистам быстро включать функции OCR в свои приложения, не сталкиваясь со сложностями базового API. Независимо от того, создаете ли вы систему управления документами, автоматизируете извлечение данных или повышаете доступность, библиотека OcrSpace Ruby — это бесценный инструмент, который оптимизирует процесс оптического распознавания символов и расширяет возможности ваших приложений с возможностью точного извлечения текста.

Краткий обзор

Обзор возможностей OcrSpace.

Обзор возможностей

<ул>

Выполнить распознавание текста

Добавить возможности распознавания

Распознавание текста изображения

Загрузка изображений по URL

Конвертировать PDF в текст

Текст распознанного шрифта

Поиск в PDF

Другие языки

Создание приложений для распознавания текста

Сохранить в браузере

Извлечь текст

Поддержка многопоточности

OcrSpace

OcrSpace поддерживает популярные форматы файлов сжатия, перечисленные ниже.

Читатель

PNG, JPEG, BMP, TIFF, TGA, DICOM

Писатель

PNG, JPEG, BMP, TIFF

OcrSpace

Независимость от платформы

OcrSpace требует только Ruby Runtime.

Ruby 5.1 и более поздние версии.

OcrSpace

Начало работы с OcrSpace

Рекомендуемый способ установки OcrSpace — использование Rubygems. Пожалуйста, используйте следующую команду для плавной установки.

Установите OcrSpace через Rubygems

$ gem install ocr_space

Вы можете загрузить скомпилированную общую библиотеку из репозитория Github.

Преобразование изображений из URL в текст через Ruby API

Библиотека OcrSpace с открытым исходным кодом включает в себя несколько мощных функций для загрузки различных типов изображений и преобразования их в текст с помощью пары строк кода Ruby. Библиотека поддерживает различные варианты оптического распознавания символов, включая извлечение текста из изображений, отсканированных документов и файлов PDF. Если разработчикам программного обеспечения необходимо обрабатывать счета-фактуры, квитанции или любые другие типы документов, библиотека OcrSpace Ruby может эффективно справиться с этим. В следующем примере показано, как разработчики программного обеспечения могут преобразовывать изображения в текст через URL-адрес с помощью Ruby API.

Конвертируйте изображения из URL-адреса через Ruby API

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Расширенные возможности оптического распознавания символов через Ruby API

Библиотека OcrSpace с открытым исходным кодом включает в себя несколько очень полезных и расширенных функций для обработки операций OCR внутри приложений Ruby. Он может точно распознавать текст на изображениях с низким разрешением, искаженный текст и даже рукописный контент, обеспечивая надежные результаты в различных сценариях. Помимо извлечения текста, библиотека также позволяет разработчикам извлекать другую важную информацию из документов. Это включает в себя извлечение координат распознанного текста, определение номеров страниц и выявление конкретных областей интереса в документе.

Как извлечь текст из загруженного файла с помощью Ruby API?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result