Išplėstinė nemokama rubino biblioteka, skirta įkelti ir ištraukti tekstą iš vaizdų
Pirmaujantis atvirojo kodo Ruby OCR API ir vaizdo į tekstą konverteris, leidžiantis programinės įrangos kūrėjams įkelti, atpažinti ir ištraukti tekstą iš vaizdų (nuskaitytų vaizdų ir PDF failų)
Optinis simbolių atpažinimas (OCR) yra galinga technologija, leidžianti kompiuteriams atpažinti ir išgauti tekstą iš vaizdų ar nuskaitytų dokumentų. Jis turi daugybę programų, pradedant spausdintinės medžiagos skaitmeninimu ir baigiant duomenų įvedimo procesų automatizavimu. Ruby programavimo kalba viena populiari OCR biblioteka yra Ruby-Tesseract-OCR. „Ruby-Tesseract-OCR“ yra „Ruby“ perlas, naudojamas kaip „Tesseract“ OCR variklio įvyniojimas. „Tesseract“ yra atvirojo kodo OCR variklis, kurį sukūrė „Google“ ir garsėja tikslumu bei kalbos palaikymu.
Ruby-Tesseract-OCR neapsiriboja pagrindinėmis OCR galimybėmis ir siūlo papildomų funkcijų pažengusiems naudojimo atvejams. Pavyzdžiui, programinės įrangos kūrėjai vaizde gali nurodyti dominantį regioną (ROI), kad apribotų OCR analizę iki konkrečios srities. Tai ypač naudinga dirbant su sudėtingais dokumentais arba kai reikia išskirti tekstą tik iš tam tikro skyriaus. Bibliotekoje yra keletas papildomų funkcijų, skirtų OCR galimybėms pagerinti, pvz., esamo vaizdo įkėlimas, teksto ištraukimas iš vaizdų ar nuskaitytų dokumentų, HOCR (HTML OCR) išvesties gavimas ir daug daugiau.
Ruby-Tesseract-OCR perlas suteikia lengvai naudojamą sąsają, leidžiančią sąveikauti su Tesseract varikliu, todėl Ruby kūrėjai gali lengvai integruoti OCR galimybes į savo projektus. Nesvarbu, ar jums reikia išgauti informaciją iš sąskaitų faktūrų, skaitmeninti spausdintą medžiagą, ar automatizuoti duomenų įvedimo užduotis, atvirojo kodo biblioteka yra patikimas ir efektyvus sprendimas. Išbandykite ir išnaudokite OCR potencialą savo „Ruby“ projektuose jau šiandien.
Darbo su Ruby-Tesseract-OCR pradžia
Rekomenduojamas Ruby-Tesseract-OCR diegimo būdas yra naudoti Rubygems. Norėdami sklandžiai įdiegti, naudokite šią komandą.
Įdiekite Ruby-Tesseract-OCR per Rubygems
gem install tesseract-ocr
Sukompiliuotą bendrinamą biblioteką galite atsisiųsti iš Github saugyklos.
Ištraukite tekstą iš vaizdų ir nuskaitytų dokumentų naudodami Ruby
Ruby-Tesseract-OCR yra labai galinga atvirojo kodo biblioteka, leidžianti programinės įrangos kūrėjams įkelti ir išgauti tekstą iš įvairių tipų vaizdų naudojant tik kelias Ruby kodo eilutes. Biblioteka leidžia lengvai išgauti tekstą iš vaizdų, PDF failų ar nuskaitytų dokumentų. Įprasta darbo eiga apima vaizdo įkėlimą, OCR parametrų konfigūravimą ir OCR variklio iškvietimą, kad atpažintų tekstą. Kad operacija būtų sėkminga, kūrėjai turi nurodyti kelią į norimą apdoroti vaizdą ir iškviesti metodą text_for, kad išgautų tekstą. Galiausiai rezultatas bus atspausdintas konsolėje. Bibliotekoje siūlomos įvairios Fkonfigūracijos parinktys, skirtos OCR elgesiui valdyti, pvz., puslapio segmentavimo režimas, baltojo sąrašo simboliai ir kt. Šie pavyzdžiai parodo, kaip programinės įrangos kūrėjai gali įkelti JPEG vaizdą ir iš jo išgauti tekstą Ruby programose.
Kaip ištraukti tekstą iš vaizdų naudojant Ruby komandas?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
e.text_for('test/first.png').strip # => 'ABC'
Teksto ištraukimas iš tam tikros vaizdo srities per rubiną
Atvirojo kodo Ruby-Tesseract-OCR biblioteka viršija pagrindines OCR galimybes ir siūlo papildomų funkcijų pažengusiems naudojimo atvejams. Pavyzdžiui, vartotojai gali nurodyti dominantį regioną (ROI) vaizde, kad apribotų OCR analizę iki konkrečios srities. Tai ypač naudinga dirbant su sudėtingais dokumentais arba kai vartotojams tereikia ištraukti tekstą iš konkrečios dalies. Be to, bibliotekoje pateikiami metodai, kaip gauti HOCR (HTML OCR) išvestį, kuri apima ne tik atpažintą tekstą, bet ir informaciją apie teksto elementų išdėstymą bei koordinates. HOCR išvestis yra naudinga, kai reikia išsamesnių duomenų arba norite atlikti tolesnę teksto struktūros analizę.
Kaip atlikti hOCR vaizde per Ruby Library?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
puts e.hocr_for('test/first.png')