1. Produkti
  2.   OCR
  3.   Ruby
  4.   OcrSpace
 
  

Atvērtā pirmkoda rubīna bibliotēka, lai tiešsaistē pārvērstu attēlus tekstā

Bezmaksas rubīna optiskās rakstzīmju atpazīšanas (OCR) bibliotēka ļauj programmatūras izstrādātājiem ielādēt, lasīt un pārveidot attēlus, PDF failus vai skenētus dokumentus tekstā vai meklējamos dokumentos.

Optiskās rakstzīmju atpazīšanas (OCR) tehnoloģija pēdējos gados ir guvusi ievērojamus uzlabojumus, atvieglojot datu ieguves automatizāciju no dažādiem avotiem. Tas nodrošina automatizāciju, uzlabo datu pieejamību un uzlabo produktivitāti dažādās jomās. Viens no šādiem jaudīgiem rīkiem ir OcrSpace Ruby bibliotēka, kas izstrādātājiem nodrošina vienkāršu risinājumu OCR iespēju integrēšanai Ruby lietojumprogrammās. Šī bibliotēka vienkāršo teksta izvilkšanas procesu no attēliem, skenētiem dokumentiem un PDF failiem, padarot to par lielisku izvēli izstrādātājiem, kuri meklē ērtu OCR risinājumu.

OcrSpace Ruby bibliotēka piedāvā vienkāršu un intuitīvu saskarni, kas ļauj viegli integrēt OCR iespējas Ruby lietojumprogrammās. Bibliotēkas daļai ir vairākas svarīgas funkcijas, piemēram, dažāda veida attēlu ielāde, teksta izvilkšana no attēliem, skenētu dokumentu konvertēšana tekstā, teksta izvilkšana no dokumentiem, kas rakstīti vairākās valodās, teksta atpazīšana no zemas izšķirtspējas attēliem, darbs ar roku rakstītu saturu. , atpazītā teksta koordināšu izgūšana, lappušu numuru noteikšana, konkrētu interešu jomu identificēšana un daudz kas cits.

OcrSpace Ruby bibliotēka ir Ocr.Space OCR API, kas piedāvā uzticamu un precīzu teksta izvilkšanu no attēliem un PDF dokumentiem. Šī bibliotēka ir īpaši izstrādāta Ruby izstrādātājiem, un tā vienkāršo integrācijas procesu, ļaujot programmētājiem ātri iekļaut OCR funkcionalitāti savās lietojumprogrammās, neriskējot ar pamatā esošās API sarežģītību. Neatkarīgi no tā, vai veidojat dokumentu pārvaldības sistēmu, automatizējat datu ieguvi vai uzlabojat pieejamību, OcrSpace Ruby bibliotēka ir nenovērtējams rīks, kas racionalizē OCR procesu un nodrošina jūsu lietojumprogrammām precīzas teksta izvilkšanas iespējas.

Previous Next

Darba sākšana ar OcrSpace

Ieteicamais veids, kā instalēt OcrSpace, ir izmantot Rubygems. Lūdzu, izmantojiet šo komandu vienmērīgai instalēšanai.

Instalējiet OcrSpace, izmantojot Rubygems

$ gem install ocr_space 

Varat lejupielādēt apkopoto koplietoto bibliotēku no Github krātuves.

Pārveidojiet attēlus no URL uz tekstu, izmantojot Ruby API

Atvērtā pirmkoda OcrSpace bibliotēkā ir iekļauti daži jaudīgi līdzekļi dažādu veidu attēlu ielādei un konvertēšanai tekstā, izmantojot pāris Ruby koda rindiņas. Bibliotēka atbalsta dažādas OCR opcijas, tostarp teksta izvilkšanu no attēliem, skenētiem dokumentiem un PDF failiem. Neatkarīgi no tā, vai programmatūras izstrādātājiem ir jāapstrādā rēķini, kvītis vai cita veida dokumenti, OcrSpace Ruby bibliotēka var ar to rīkoties efektīvi. Šis piemērs parāda, kā programmatūras izstrādātāji var pārvērst attēlus tekstā, izmantojot URL, izmantojot Ruby API.

Pārveidojiet attēlus no URL, izmantojot Ruby API

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Papildu OCR iespējas, izmantojot Ruby API

Atvērtā pirmkoda OcrSpace bibliotēkā ir iekļauti daži ļoti noderīgi un uzlaboti līdzekļi OCR darbību apstrādei Ruby lietojumprogrammās. Tas var precīzi atpazīt tekstu no zemas izšķirtspējas attēliem, izkropļota teksta un pat ar roku rakstīta satura, nodrošinot uzticamus rezultātus dažādos scenārijos. Papildus teksta izvilkšanai bibliotēka ļauj izstrādātājiem no dokumentiem iegūt arī citu svarīgu informāciju. Tas ietver atpazītā teksta koordinātu izgūšanu, lappušu numuru noteikšanu un konkrētu interešu jomu noteikšanu dokumentā.

Kā izvilkt tekstu no augšupielādēta faila, izmantojot Ruby API?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result
 Latviski