Biblioteka Open Source Ruby do konwersji obrazów na tekst online

Bezpłatna biblioteka Ruby Optical Character Recognition (OCR) umożliwia twórcom oprogramowania ładowanie, odczytywanie i konwertowanie obrazów, plików PDF lub zeskanowanych dokumentów na tekst lub dokumenty z możliwością wyszukiwania

W technologii optycznego rozpoznawania znaków (OCR) poczyniono w ostatnich latach znaczny postęp, ułatwiając automatyzację wyodrębniania danych z różnych źródeł. Umożliwia automatyzację, poprawia dostępność danych i zwiększa produktywność w różnych dziedzinach. Jednym z takich potężnych narzędzi jest biblioteka OcrSpace Ruby, która zapewnia programistom proste rozwiązanie do integracji funkcji OCR z aplikacjami Ruby. Ta biblioteka upraszcza proces wyodrębniania tekstu z obrazów, zeskanowanych dokumentów i plików PDF, co czyni ją doskonałym wyborem dla programistów poszukujących wygodnego rozwiązania OCR.

Biblioteka OcrSpace Ruby oferuje prosty i intuicyjny interfejs, ułatwiający integrację funkcji OCR z aplikacjami Ruby. Biblioteka zawiera kilka ważnych funkcji, takich jak ładowanie różnych typów obrazów, wyodrębnianie tekstu z obrazów, konwertowanie zeskanowanych dokumentów na tekst, wyodrębnianie tekstu z dokumentów napisanych w wielu językach, rozpoznawanie tekstu z obrazów o niskiej rozdzielczości, praca z treścią odręczną , pobieranie współrzędnych rozpoznanego tekstu, wykrywanie numerów stron, identyfikowanie konkretnych obszarów zainteresowań i wiele innych.

Biblioteka OcrSpace Ruby to pakiet oprogramowania Ocr.Space OCR API, który zapewnia niezawodne i dokładne wyodrębnianie tekstu z obrazów i dokumentów PDF. Biblioteka ta, stworzona specjalnie dla programistów Ruby, upraszcza proces integracji, umożliwiając programistom szybkie włączenie funkcjonalności OCR do swoich aplikacji bez zajmowania się złożonością podstawowego API. Niezależnie od tego, czy budujesz system zarządzania dokumentami, automatyzujesz ekstrakcję danych, czy zwiększasz dostępność, biblioteka OcrSpace Ruby jest nieocenionym narzędziem, które usprawnia proces OCR i zapewnia aplikacjom dokładne możliwości wyodrębniania tekstu.

W skrócie

Przegląd funkcji OcrSpace.

Przegląd funkcji

Wykonaj OCR
Dodaj możliwości OCR
Rozpoznaj tekst obrazu
Wczytaj obrazy poprzez adres URL
Konwertuj tekst PDF
Rozpoznany tekst czcionki
Wyszukaj plik PDF
Inne języki
Twórz aplikacje OCR
Zapisz w przeglądarce
Wyodrębnij tekst
Obsługa wielowątkowości

OcrSpace

OcrSpace obsługuje popularne formaty plików kompresji wymienione poniżej.

Czytelnik

PNG, JPEG, BMP, TIFF, TGA, DICOM

Pisarz

PNG, JPEG, BMP, TIFF

OcrSpace

Niezależność od platformy

OcrSpace wymaga jedynie środowiska wykonawczego Ruby.

Ruby 5.1 i nowsze.

OcrSpace

Pierwsze kroki z OcrSpace

Zalecany sposób instalacji OcrSpace polega na użyciu Rubygems. Aby instalacja przebiegła bezproblemowo, użyj poniższego polecenia.

Zainstaluj OcrSpace poprzez Rubygems

$ gem install ocr_space

Możesz pobrać skompilowaną bibliotekę współdzieloną z repozytorium Github.

Konwertuj obrazy z adresu URL na tekst za pomocą Ruby API

Biblioteka OcrSpace o otwartym kodzie źródłowym zawiera kilka zaawansowanych funkcji umożliwiających ładowanie różnych typów obrazów i konwertowanie ich na tekst za pomocą kilku linii kodu Ruby. Biblioteka obsługuje różne opcje OCR, w tym wyodrębnianie tekstu z obrazów, zeskanowanych dokumentów i plików PDF. Niezależnie od tego, czy twórcy oprogramowania muszą przetwarzać faktury, paragony czy jakikolwiek inny typ dokumentu, biblioteka OcrSpace Ruby poradzi sobie z tym skutecznie. Poniższy przykład pokazuje, jak twórcy oprogramowania mogą konwertować obrazy na tekst za pośrednictwem adresu URL przy użyciu interfejsu API Ruby.

Konwertuj obrazy z adresu URL za pomocą Ruby API

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Zaawansowane możliwości OCR poprzez Ruby API

Biblioteka OcrSpace o otwartym kodzie źródłowym zawiera kilka bardzo przydatnych i zaawansowanych funkcji do obsługi operacji OCR w aplikacjach Ruby. Potrafi dokładnie rozpoznać tekst z obrazów o niskiej rozdzielczości, zniekształconego tekstu, a nawet treści pisanych odręcznie, zapewniając niezawodne wyniki w różnych scenariuszach. Oprócz wyodrębniania tekstu biblioteka umożliwia także programistom wyodrębnianie innych ważnych informacji z dokumentów. Obejmuje to pobieranie współrzędnych rozpoznanego tekstu, wykrywanie numerów stron i identyfikowanie konkretnych obszarów zainteresowania w dokumencie.

Jak wyodrębnić tekst z przesłanego pliku za pomocą Ruby API?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result