Разширена безплатна библиотека Ruby за зареждане и извличане на текст от изображения

Водещ Ruby OCR API с отворен код и конвертор на изображение към текст, който позволява на разработчиците на софтуер да зареждат, разпознават и извличат текст от изображения (сканирани изображения и PDF файлове)

Оптичното разпознаване на знаци (OCR) е мощна технология, която позволява на компютрите да разпознават и извличат текст от изображения или сканирани документи. Има множество приложения, вариращи от дигитализиране на печатни материали до автоматизиране на процесите на въвеждане на данни. В езика за програмиране Ruby една популярна библиотека за OCR е Ruby-Tesseract-OCR. Ruby-Tesseract-OCR е скъпоценен камък на Ruby, който служи като обвивка за Tesseract OCR двигателя. Tesseract е OCR машина с отворен код, разработена от Google и е известна със своята точност и езикова поддръжка.

Ruby-Tesseract-OCR надхвърля основните възможности за OCR и предлага допълнителни функции за напреднали случаи на употреба. Например разработчиците на софтуер могат да посочат регион на интерес (ROI) в рамките на изображение, за да ограничат OCR анализа до конкретна област. Това е особено полезно, когато работите със сложни документи или когато трябва да извлечете текст само от конкретен раздел. Библиотеката предоставя няколко допълнителни функции за подобряване на възможностите за OCR, като зареждане на съществуващо изображение, извличане на текст от изображения или сканирани документи, получаване на HOCR (HTML OCR) изход и много други.

Скъпоценният камък Ruby-Tesseract-OCR осигурява лесен за използване интерфейс за взаимодействие с двигателя Tesseract, което позволява на разработчиците на Ruby да интегрират възможностите за OCR в своите проекти без усилие. Независимо дали трябва да извлечете информация от фактури, да дигитализирате печатни материали или да автоматизирате задачи за въвеждане на данни, библиотеката с отворен код предоставя надеждно и ефикасно решение. Опитайте и отключете потенциала на OCR във вашите Ruby проекти днес.

С един поглед

Общ преглед на функциите на Ruby-Tesseract-OCR.

Преглед на характеристиките

Извършване на OCR
Добавяне на възможности за OCR
Разпознаване на текст на изображение
Зареждане на изображения чрез URL
Конвертиране на PDF в текст
Текст на разпознат шрифт
Търсене в PDF
Други езици
Създаване на OCR приложения
Запазване в браузър
Извличане на текст
Поддръжка на много нишки

Ruby-Tesseract-OCR

Ruby-Tesseract-OCR поддържа популярни OCR файлови формати, изброени по-долу.

Читател

PNG, JPEG, BMP, TIFF, TGA, DICOM

Писател

PNG, JPEG, BMP, TIFF

Ruby-Tesseract-OCR

Независимост на платформата

Ruby-Tesseract-OCR изисква само Ruby Runtime.

Ruby 5.1 и по-нова версия.

Ruby-Tesseract-OCR

Първи стъпки с Ruby-Tesseract-OCR

Препоръчителният начин за инсталиране на Ruby-Tesseract-OCR е използването на Rubygems. Моля, използвайте следната команда за гладка инсталация.

Инсталирайте Ruby-Tesseract-OCR чрез Rubygems

gem install tesseract-ocr

Можете да изтеглите компилираната споделена библиотека от хранилището на Github.

Извличане на текст от изображения и сканирани документи чрез Ruby

Ruby-Tesseract-OCR е много мощна библиотека с отворен код, която позволява на разработчиците на софтуер да зареждат и извличат текст от различни видове изображения само с няколко реда Ruby код. Библиотеката улеснява извличането на текст от изображения, PDF файлове или сканирани документи. Типичният работен процес включва зареждане на изображение, конфигуриране на OCR параметрите и извикване на OCR механизма за разпознаване на текста. За успешна операция разработчиците трябва да предоставят пътя до изображението, което искат да обработят, и да извикат метода text_for за извличане на текста. Накрая резултатът ще бъде отпечатан на конзолата. Библиотеката предлага различни опции за Fконфигуриране за контролиране на поведението на OCR, като например режим на сегментиране на страници, символи в белия списък и др. Следните примери показват как разработчиците на софтуер могат да заредят JPEG изображение и да извлекат текст от него в Ruby приложения.

Как да извлечете текст от изображения с помощта на Ruby команди?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

Извличане на текст от конкретна област на изображение чрез Ruby

Библиотеката Ruby-Tesseract-OCR с отворен код надхвърля основните възможности за OCR и предлага допълнителни функции за напреднали случаи на употреба. Например, потребителите могат да посочат регион на интерес (ROI) в рамките на изображение, за да ограничат OCR анализа до конкретна област. Това е особено полезно, когато се работи със сложни документи или когато потребителите трябва само да извлекат текст от конкретен раздел. Освен това библиотеката предоставя методи за получаване на HOCR (HTML OCR) изход, който включва не само разпознатия текст, но и информация за оформлението и координатите на текстовите елементи. Изходът от HOCR е полезен, когато имате нужда от по-подробни данни или искате да извършите допълнителен анализ на структурата на текста.

Как да изпълните hOCR върху изображение чрез Ruby Library?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')