Open Source Ruby Library pro převod obrázků na text online

Bezplatná knihovna Ruby Optical Character Recognition (OCR) umožňuje vývojářům softwaru načítat, číst a převádět obrázky, soubory PDF nebo naskenované dokumenty na text nebo dokumenty s možností vyhledávání

Technologie optického rozpoznávání znaků (OCR) zaznamenala v posledních letech významný pokrok a usnadňuje automatizaci extrakce dat z různých zdrojů. Umožňuje automatizaci, zlepšuje dostupnost dat a zvyšuje produktivitu v různých oblastech. Jedním z takových výkonných nástrojů je knihovna OcrSpace Ruby, která vývojářům poskytuje přímočaré řešení pro integraci funkcí OCR do jejich aplikací Ruby. Tato knihovna zjednodušuje proces extrahování textu z obrázků, naskenovaných dokumentů a souborů PDF, takže je vynikající volbou pro vývojáře, kteří hledají vhodné řešení OCR.

Knihovna OcrSpace Ruby nabízí přímé a intuitivní rozhraní, které usnadňuje integraci funkcí OCR do aplikací Ruby. Součástí knihovny je několik důležitých funkcí, jako je načítání různých typů obrázků, extrahování textu z obrázků, převod naskenovaných dokumentů na text, extrahování textu z dokumentů napsaných ve více jazycích, rozpoznávání textu z obrázků s nízkým rozlišením, práce s ručně psaným obsahem. , získávání souřadnic rozpoznaného textu, zjišťování čísel stránek, identifikace konkrétních oblastí zájmu a mnoho dalších.

Knihovna OcrSpace Ruby je obal kolem rozhraní Ocr.Space OCR API, které nabízí spolehlivou a přesnou extrakci textu z obrázků a dokumentů PDF. Tato knihovna, vytvořená speciálně pro vývojáře Ruby, zjednodušuje proces integrace a umožňuje programátorům rychle začlenit funkce OCR do svých aplikací, aniž by se museli zabývat složitostí základního API. Ať už budujete systém správy dokumentů, automatizujete extrakci dat nebo zlepšujete dostupnost, knihovna OcrSpace Ruby je neocenitelným nástrojem, který zjednodušuje proces OCR a umožňuje vašim aplikacím přesné možnosti extrakce textu.

Na první pohled

Přehled funkcí OcrSpace.

Přehled funkcí

Proveďte OCR
Přidat možnosti OCR
Rozpoznat text obrázku
Načíst obrázky prostřednictvím adresy URL
Převést PDF tp text
Rozpoznaný text písma
Prohledat PDF
Další jazyky
Vytvářejte aplikace OCR
Uložit do prohlížeče
Extrahovat text
Podpora více vláken

OcrSpace

OcrSpace podporuje oblíbené formáty kompresních souborů uvedené níže.

Čtenář

PNG, JPEG, BMP, TIFF, TGA, DICOM

Spisovatel

PNG, JPEG, BMP, TIFF

OcrSpace

Nezávislost na platformě

OcrSpace vyžaduje pouze Ruby Runtime.

Ruby 5.1 a vyšší.

OcrSpace

Začínáme s OcrSpace

Doporučený způsob instalace OcrSpace je použití Rubygems. Pro bezproblémovou instalaci použijte prosím následující příkaz.

Nainstalujte OcrSpace přes Rubygems

$ gem install ocr_space

Zkompilovanou sdílenou knihovnu si můžete stáhnout z úložiště Github.

Převod obrázků z adresy URL na text pomocí rozhraní Ruby API

Open source knihovna OcrSpace obsahuje některé výkonné funkce pro načítání různých typů obrázků a jejich převod na text pomocí několika řádků kódu Ruby. Knihovna podporuje různé možnosti OCR, včetně extrahování textu z obrázků, naskenovaných dokumentů a souborů PDF. Ať už vývojáři softwaru potřebují zpracovávat faktury, účtenky nebo jakýkoli jiný typ dokumentu, knihovna OcrSpace Ruby to dokáže efektivně zpracovat. Následující příklad ukazuje, jak mohou vývojáři softwaru převádět obrázky na text prostřednictvím adresy URL pomocí rozhraní Ruby API.

Převod obrázků z adresy URL prostřednictvím rozhraní Ruby API

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Pokročilé možnosti OCR prostřednictvím rozhraní Ruby API

Open source knihovna OcrSpace obsahuje některé velmi užitečné a pokročilé funkce pro zpracování operací OCR v aplikacích Ruby. Dokáže přesně rozpoznat text z obrázků s nízkým rozlišením, zkreslený text a dokonce i ručně psaný obsah, což zajišťuje spolehlivé výsledky v různých scénářích. Kromě extrakce textu knihovna také umožňuje vývojářům extrahovat další důležité informace z dokumentů. To zahrnuje získávání souřadnic rozpoznaného textu, zjišťování čísel stránek a identifikaci konkrétních oblastí zájmu v dokumentu.

Jak extrahovat text z nahraného souboru přes rozhraní Ruby API?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result