Pokročilá bezplatná knihovna Ruby pro načítání a extrahování textu z obrázků

Přední Open Source Ruby OCR API a převaděč obrázků na text, který umožňuje vývojářům softwaru načítat, rozpoznávat a extrahovat text z obrázků (naskenované obrázky a soubory PDF)

Optické rozpoznávání znaků (OCR) je výkonná technologie, která počítačům umožňuje rozpoznávat a extrahovat text z obrázků nebo naskenovaných dokumentů. Má četné aplikace, od digitalizace tištěných materiálů až po automatizaci procesů zadávání dat. V programovacím jazyce Ruby je jednou z populárních knihoven pro OCR Ruby-Tesseract-OCR. Ruby-Tesseract-OCR je drahokam Ruby, který slouží jako obal pro OCR engine Tesseract. Tesseract je Open Source OCR engine vyvinutý společností Google a je známý svou přesností a jazykovou podporou.

Ruby-Tesseract-OCR přesahuje základní možnosti OCR a nabízí další funkce pro pokročilé případy použití. Vývojáři softwaru mohou například specifikovat oblast zájmu (ROI) v rámci snímku a omezit tak analýzu OCR na určitou oblast. To je užitečné zejména při práci se složitými dokumenty nebo když potřebujete extrahovat text pouze z určité části. Knihovna poskytuje několik dalších funkcí pro vylepšení schopností OCR, jako je načítání existujícího obrázku, extrahování textu z obrázků nebo naskenovaných dokumentů, získávání výstupu HOCR (HTML OCR) a mnoho dalších.

Gem Ruby-Tesseract-OCR poskytuje snadno použitelné rozhraní pro interakci s enginem Tesseract, což umožňuje vývojářům Ruby integrovat funkce OCR do svých projektů bez námahy. Ať už potřebujete extrahovat informace z faktur, digitalizovat tištěné materiály nebo automatizovat úlohy zadávání dat, open source knihovna poskytuje spolehlivé a efektivní řešení. Vyzkoušejte to a odemkněte potenciál OCR ve svých projektech Ruby ještě dnes.

Na první pohled

Přehled funkcí Ruby-Tesseract-OCR.

Přehled funkcí

Proveďte OCR
Přidat možnosti OCR
Rozpoznat text obrázku
Načíst obrázky prostřednictvím adresy URL
Převést PDF tp text
Rozpoznaný text písma
Prohledat PDF
Další jazyky
Vytvářejte aplikace OCR
Uložit do prohlížeče
Extrahovat text
Podpora více vláken

Ruby-Tesseract-OCR

Ruby-Tesseract-OCR podporuje oblíbené formáty souborů OCR uvedené níže.

Čtenář

PNG, JPEG, BMP, TIFF, TGA, DICOM

Spisovatel

PNG, JPEG, BMP, TIFF

Ruby-Tesseract-OCR

Nezávislost na platformě

Ruby-Tesseract-OCR vyžaduje pouze Ruby Runtime.

Ruby 5.1 a vyšší.

Ruby-Tesseract-OCR

Začínáme s Ruby-Tesseract-OCR

Doporučený způsob instalace Ruby-Tesseract-OCR je použití Rubygems. Pro bezproblémovou instalaci použijte prosím následující příkaz.

Nainstalujte Ruby-Tesseract-OCR přes Rubygems

gem install tesseract-ocr

Zkompilovanou sdílenou knihovnu si můžete stáhnout z úložiště Github.

Extrahujte text z obrázků a naskenovaných dokumentů prostřednictvím Ruby

Ruby-Tesseract-OCR je velmi výkonná knihovna s otevřeným zdrojovým kódem, která umožňuje vývojářům softwaru načítat a extrahovat text z různých typů obrázků pomocí pouhých několika řádků kódu Ruby. Knihovna usnadňuje extrahování textu z obrázků, PDF nebo naskenovaných dokumentů. Typický pracovní postup zahrnuje načtení obrázku, konfiguraci parametrů OCR a vyvolání nástroje OCR k rozpoznání textu. Pro úspěšnou operaci musí vývojáři poskytnout cestu k obrázku, který chtějí zpracovat, a zavolat metodu text_for pro extrakci textu. Nakonec bude výsledek vytištěn na konzole. Knihovna nabízí různé možnosti konfigurace F pro ovládání chování OCR, jako je režim segmentace stránky, seznam povolených znaků a další. Následující příklady ukazují, jak mohou vývojáři softwaru načíst obrázek JPEG a extrahovat z něj text v aplikacích Ruby.

Jak extrahovat text z obrázků pomocí příkazů Ruby?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

Extrahujte text z konkrétní oblasti obrázku pomocí Ruby

Open source knihovna Ruby-Tesseract-OCR přesahuje základní možnosti OCR a nabízí další funkce pro pokročilé případy použití. Uživatelé mohou například určit oblast zájmu (ROI) v rámci snímku a omezit tak analýzu OCR na určitou oblast. To je užitečné zejména při práci se složitými dokumenty nebo když uživatelé potřebují extrahovat text pouze z určité části. Knihovna navíc poskytuje metody pro získání výstupu HOCR (HTML OCR), který zahrnuje nejen rozpoznaný text, ale také informace o rozložení a souřadnicích textových prvků. Výstup HOCR je užitečný, když potřebujete podrobnější data nebo chcete provést další analýzu struktury textu.

Jak provést hOCR na obrázku prostřednictvím knihovny Ruby?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')