1. Товары
  2.   OCR
  3.   Ruby
  4.   Ruby-Tesseract-OCR
 
  

Расширенная бесплатная библиотека Ruby для загрузки и извлечения текста из изображений

Ведущий API-интерфейс Ruby OCR с открытым исходным кодом и конвертер изображений в текст, который позволяет разработчикам программного обеспечения загружать, распознавать и извлекать текст из изображений (отсканированные изображения и файлы PDF).

Оптическое распознавание символов (OCR) – это мощная технология, позволяющая компьютерам распознавать и извлекать текст из изображений или отсканированных документов. Он имеет множество применений: от оцифровки печатных материалов до автоматизации процессов ввода данных. В языке программирования Ruby одной из популярных библиотек для оптического распознавания символов является Ruby-Tesseract-OCR. Ruby-Tesseract-OCR — это драгоценный камень Ruby, который служит оболочкой для механизма OCR Tesseract. Tesseract – это механизм оптического распознавания символов с открытым исходным кодом, разработанный Google и известный своей точностью и языковой поддержкой.

Ruby-Tesseract-OCR выходит за рамки базовых возможностей оптического распознавания символов и предлагает дополнительные функции для расширенных вариантов использования. Например, разработчики программного обеспечения могут указать интересующую область (ROI) на изображении, чтобы ограничить анализ OCR определенной областью. Это особенно полезно при работе со сложными документами или когда вам нужно извлечь текст только из определенного раздела. Библиотека предоставляет несколько дополнительных функций для расширения возможностей оптического распознавания символов, таких как загрузка существующего изображения, извлечение текста из изображений или отсканированных документов, получение выходных данных HOCR (HTML OCR) и многое другое.

Гем Ruby-Tesseract-OCR предоставляет простой в использовании интерфейс для взаимодействия с механизмом Tesseract, что позволяет разработчикам Ruby легко интегрировать возможности OCR в свои проекты. Если вам нужно извлечь информацию из счетов-фактур, оцифровать печатные материалы или автоматизировать задачи по вводу данных, библиотека с открытым исходным кодом предоставит надежное и эффективное решение. Попробуйте и раскройте потенциал OCR в своих проектах Ruby уже сегодня.

Previous Next

Начало работы с Ruby-Tesseract-OCR

Рекомендуемый способ установки Ruby-Tesseract-OCR — использование Rubygems. Пожалуйста, используйте следующую команду для плавной установки.

Установите Ruby-Tesseract-OCR через Rubygems

gem install tesseract-ocr 

Вы можете загрузить скомпилированную общую библиотеку из репозитория Github.

Извлечение текста из изображений и отсканированных документов с помощью Ruby

Ruby-Tesseract-OCR — это очень мощная библиотека с открытым исходным кодом, которая позволяет разработчикам программного обеспечения загружать и извлекать текст из изображений различных типов с помощью всего лишь пары строк кода Ruby. Библиотека позволяет легко извлекать текст из изображений, PDF-файлов или отсканированных документов. Типичный рабочий процесс включает загрузку изображения, настройку параметров OCR и вызов механизма OCR для распознавания текста. Для успешной операции разработчикам необходимо указать путь к изображению, которое они хотят обработать, и вызвать метод text_for для извлечения текста. Наконец, результат будет выведен на консоль. Библиотека предлагает различные параметры конфигурации F для управления поведением OCR, такие как режим сегментации страниц, символы белого списка и многое другое. В следующих примерах показано, как разработчики программного обеспечения могут загружать изображение JPEG и извлекать из него текст внутри приложений Ruby.

Как извлечь текст из изображений с помощью команд Ruby?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

Извлечение текста из определенной области изображения с помощью Ruby

Библиотека Ruby-Tesseract-OCR с открытым исходным кодом выходит за рамки базовых возможностей оптического распознавания символов и предлагает дополнительные функции для расширенных вариантов использования. Например, пользователи могут указать интересующую область (ROI) на изображении, чтобы ограничить анализ OCR определенной областью. Это особенно полезно при работе со сложными документами или когда пользователям нужно извлечь текст только из определенного раздела. Кроме того, библиотека предоставляет методы для получения вывода HOCR (HTML OCR), который включает не только распознанный текст, но и информацию о расположении и координатах текстовых элементов. Вывод HOCR полезен, когда вам нужны более подробные данные или вы хотите выполнить дальнейший анализ текстовой структуры.

Как выполнить hOCR для изображения через библиотеку Ruby?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')
 Русский