Zaawansowana bezpłatna biblioteka Ruby do ładowania i wyodrębniania tekstu z obrazów
Wiodący interfejs API Open Source Ruby OCR i konwerter obrazu na tekst, który umożliwia programistom ładowanie, rozpoznawanie i wyodrębnianie tekstu z obrazów (zeskanowanych obrazów i plików PDF)
Optyczne rozpoznawanie znaków (OCR) to zaawansowana technologia umożliwiająca komputerom rozpoznawanie i wyodrębnianie tekstu z obrazów lub zeskanowanych dokumentów. Ma wiele zastosowań, począwszy od digitalizacji materiałów drukowanych po automatyzację procesów wprowadzania danych. W języku programowania Ruby popularną biblioteką do OCR jest Ruby-Tesseract-OCR. Ruby-Tesseract-OCR to klejnot Ruby, który służy jako opakowanie dla silnika Tesseract OCR. Tesseract to silnik OCR typu open source opracowany przez Google i znany ze swojej dokładności i obsługi językowej.
Ruby-Tesseract-OCR wykracza poza podstawowe możliwości OCR i oferuje dodatkowe funkcje dla zaawansowanych przypadków użycia. Na przykład twórcy oprogramowania mogą określić obszar zainteresowania (ROI) w obrazie, aby ograniczyć analizę OCR do określonego obszaru. Jest to szczególnie przydatne, gdy mamy do czynienia ze złożonymi dokumentami lub gdy wystarczy wyodrębnić tekst z określonej sekcji. Biblioteka udostępnia kilka dodatkowych funkcji zwiększających możliwości OCR, takich jak ładowanie istniejącego obrazu, wyodrębnianie tekstu z obrazów lub zeskanowanych dokumentów, uzyskiwanie danych wyjściowych HOCR (HTML OCR) i wiele innych.
Gem Ruby-Tesseract-OCR zapewnia łatwy w użyciu interfejs do interakcji z silnikiem Tesseract, umożliwiając programistom Ruby bezproblemową integrację funkcji OCR ze swoimi projektami. Niezależnie od tego, czy chcesz wyodrębnić informacje z faktur, zdigitalizować materiały drukowane, czy zautomatyzować zadania związane z wprowadzaniem danych, biblioteka open source zapewnia niezawodne i wydajne rozwiązanie. Spróbuj i już dziś odblokuj potencjał OCR w swoich projektach Ruby.
Pierwsze kroki z Ruby-Tesseract-OCR
Zalecany sposób instalacji Ruby-Tesseract-OCR polega na użyciu Rubygems. Aby instalacja przebiegła bezproblemowo, użyj poniższego polecenia.
Zainstaluj Ruby-Tesseract-OCR poprzez Rubygems
gem install tesseract-ocr
Możesz pobrać skompilowaną bibliotekę współdzieloną z repozytorium Github.
Wyodrębnij tekst z obrazów i zeskanowanych dokumentów za pomocą Ruby
Ruby-Tesseract-OCR to bardzo potężna biblioteka typu open source, która umożliwia programistom ładowanie i wyodrębnianie tekstu z różnych typów obrazów za pomocą zaledwie kilku linii kodu Ruby. Biblioteka ułatwia wyodrębnianie tekstu z obrazów, plików PDF lub zeskanowanych dokumentów. Typowy przepływ pracy obejmuje ładowanie obrazu, konfigurowanie parametrów OCR i wywoływanie silnika OCR w celu rozpoznania tekstu. Aby operacja przebiegła pomyślnie, programiści muszą podać ścieżkę do obrazu, który chcą przetworzyć, i wywołać metodę text_for w celu wyodrębnienia tekstu. Na koniec wynik zostanie wydrukowany na konsoli. Biblioteka oferuje różne opcje konfiguracji F do kontrolowania zachowania OCR, takie jak tryb segmentacji strony, znaki białej listy i inne. Poniższe przykłady pokazują, jak twórcy oprogramowania mogą załadować obraz JPEG i wyodrębnić z niego tekst do aplikacji Ruby.
Jak wyodrębnić tekst z obrazów za pomocą poleceń Ruby?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
e.text_for('test/first.png').strip # => 'ABC'
Wyodrębnij tekst z określonego obszaru obrazu za pomocą Ruby
Biblioteka Ruby-Tesseract-OCR o otwartym kodzie źródłowym wykracza poza podstawowe możliwości OCR i oferuje dodatkowe funkcje dla zaawansowanych zastosowań. Na przykład użytkownicy mogą określić obszar zainteresowania (ROI) w obrazie, aby ograniczyć analizę OCR do określonego obszaru. Jest to szczególnie przydatne w przypadku złożonych dokumentów lub gdy użytkownicy muszą jedynie wyodrębnić tekst z określonej sekcji. Dodatkowo biblioteka udostępnia metody uzyskiwania danych wyjściowych HOCR (HTML OCR), które obejmują nie tylko rozpoznany tekst, ale także informacje o układzie i współrzędnych elementów tekstowych. Dane wyjściowe HOCR są przydatne, gdy potrzebne są bardziej szczegółowe dane lub chcesz przeprowadzić dalszą analizę struktury tekstu.
Jak wykonać hOCR na obrazie za pomocą biblioteki Ruby?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
puts e.hocr_for('test/first.png')