Uzlabota bezmaksas rubīna bibliotēka, lai ielādētu un izvilktu tekstu no attēliem
Vadošais atvērtā pirmkoda Ruby OCR API un attēla teksta pārveidotājs, kas programmatūras izstrādātājiem ļauj ielādēt, atpazīt un izvilkt tekstu no attēliem (skenēti attēli un PDF faili)
Optiskā rakstzīmju atpazīšana (OCR) ir jaudīga tehnoloģija, kas ļauj datoriem atpazīt un izvilkt tekstu no attēliem vai skenētiem dokumentiem. Tam ir daudz lietojumprogrammu, sākot no drukāto materiālu digitalizēšanas līdz datu ievades procesu automatizēšanai. Ruby programmēšanas valodā viena populāra OCR bibliotēka ir Ruby-Tesseract-OCR. Ruby-Tesseract-OCR ir Ruby dārgakmens, kas kalpo kā Tesseract OCR dzinēja iesaiņojums. Tesseract ir atvērtā pirmkoda OCR dzinējs, ko izstrādājis Google, un tas ir slavens ar savu precizitāti un valodas atbalstu.
Ruby-Tesseract-OCR pārsniedz pamata OCR iespējas un piedāvā papildu funkcijas uzlabotas lietošanas gadījumiem. Piemēram, programmatūras izstrādātāji var norādīt interesējošo reģionu (ROI) attēlā, lai ierobežotu OCR analīzi ar noteiktu apgabalu. Tas ir īpaši noderīgi, strādājot ar sarežģītiem dokumentiem vai ja nepieciešams tikai izvilkt tekstu no noteiktas sadaļas. Bibliotēka nodrošina vairākas papildu funkcijas OCR iespēju uzlabošanai, piemēram, esoša attēla ielāde, teksta izvilkšana no attēliem vai skenētiem dokumentiem, HOCR (HTML OCR) izvades iegūšana un daudzas citas.
Ruby-Tesseract-OCR dārgakmens nodrošina ērti lietojamu saskarni mijiedarbībai ar Tesseract dzinēju, ļaujot Ruby izstrādātājiem bez piepūles integrēt OCR iespējas savos projektos. Neatkarīgi no tā, vai jums ir nepieciešams iegūt informāciju no rēķiniem, digitalizēt drukātos materiālus vai automatizēt datu ievades uzdevumus, atvērtā koda bibliotēka nodrošina uzticamu un efektīvu risinājumu. Izmēģiniet to un izmantojiet OCR potenciālu savos Ruby projektos jau šodien.
Darba sākšana ar Ruby-Tesseract-OCR
Ieteicamais veids, kā instalēt Ruby-Tesseract-OCR, ir lietot Rubygems. Lūdzu, izmantojiet šo komandu vienmērīgai instalēšanai.
Instalējiet Ruby-Tesseract-OCR, izmantojot Rubygems
gem install tesseract-ocr
Apkopoto koplietoto bibliotēku varat lejupielādēt no Github krātuves.
Izvilkt tekstu no attēliem un skenētajiem dokumentiem, izmantojot Ruby
Ruby-Tesseract-OCR ir ļoti jaudīga atvērtā pirmkoda bibliotēka, kas programmatūras izstrādātājiem ļauj ielādēt un izvilkt tekstu no dažāda veida attēliem, izmantojot tikai dažas Ruby koda rindiņas. Bibliotēka ļauj viegli izvilkt tekstu no attēliem, PDF failiem vai skenētiem dokumentiem. Tipiskā darbplūsma ietver attēla ielādi, OCR parametru konfigurēšanu un OCR programmas izsaukšanu, lai atpazītu tekstu. Veiksmīgai darbībai izstrādātājiem ir jānorāda ceļš uz attēlu, ko viņi vēlas apstrādāt, un jāizsauc metode text_for, lai izvilktu tekstu. Visbeidzot, rezultāts tiks izdrukāts konsolē. Bibliotēka piedāvā dažādas Fkonfigurācijas opcijas, lai kontrolētu OCR darbību, piemēram, lapu segmentācijas režīmu, baltā saraksta rakstzīmes un daudz ko citu. Šie piemēri parāda, kā programmatūras izstrādātāji var ielādēt JPEG attēlu un izvilkt no tā tekstu Ruby lietojumprogrammās.
Kā izvilkt tekstu no attēliem, izmantojot Ruby komandas?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
e.text_for('test/first.png').strip # => 'ABC'
Teksta izvilkšana no konkrēta attēla apgabala, izmantojot rubīnu
Atvērtā pirmkoda Ruby-Tesseract-OCR bibliotēka pārsniedz pamata OCR iespējas un piedāvā papildu funkcijas uzlabotas lietošanas gadījumiem. Piemēram, lietotāji var norādīt interesējošo reģionu (ROI) attēlā, lai ierobežotu OCR analīzi ar noteiktu apgabalu. Tas ir īpaši noderīgi, strādājot ar sarežģītiem dokumentiem vai ja lietotājiem ir jāizņem teksts tikai no noteiktas sadaļas. Turklāt bibliotēka nodrošina metodes HOCR (HTML OCR) izvades iegūšanai, kas ietver ne tikai atpazīto tekstu, bet arī informāciju par teksta elementu izkārtojumu un koordinātām. HOCR izvade ir noderīga, ja jums ir nepieciešami sīkāki dati vai vēlaties veikt turpmāku teksta struktūras analīzi.
Kā veikt hOCR attēlam, izmantojot Ruby Library?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
puts e.hocr_for('test/first.png')