1. Produktai
  2.   OCR
  3.   Ruby
  4.   OcrSpace
 
  

Atvirojo kodo „Ruby“ biblioteka, skirta konvertuoti vaizdus į tekstą internete

Nemokama rubino optinio simbolių atpažinimo (OCR) biblioteka leidžia programinės įrangos kūrėjams įkelti, skaityti ir konvertuoti vaizdus, ​​PDF arba nuskaitytus dokumentus į tekstą arba dokumentus, kuriuose galima ieškoti

Pastaraisiais metais optinio simbolių atpažinimo (OCR) technologija padarė didelę pažangą, todėl buvo lengviau automatizuoti duomenų gavimą iš įvairių šaltinių. Tai įgalina automatizavimą, pagerina duomenų prieinamumą ir padidina produktyvumą įvairiose srityse. Vienas iš tokių galingų įrankių yra OcrSpace Ruby biblioteka, kuri suteikia kūrėjams paprastą sprendimą integruoti OCR galimybes į savo Ruby programas. Ši biblioteka supaprastina teksto ištraukimo iš vaizdų, nuskaitytų dokumentų ir PDF failų procesą, todėl tai puikus pasirinkimas kūrėjams, ieškantiems patogaus OCR sprendimo.

OcrSpace Ruby biblioteka siūlo paprastą ir intuityvią sąsają, leidžiančią lengvai integruoti OCR galimybes į Ruby programas. Yra keletas svarbių bibliotekos funkcijų, tokių kaip įvairių tipų vaizdų įkėlimas, teksto ištraukimas iš vaizdų, nuskaitytų dokumentų konvertavimas į tekstą, teksto ištraukimas iš dokumentų, parašytų keliomis kalbomis, teksto atpažinimas iš mažos raiškos vaizdų, darbas su ranka rašytu turiniu. , atpažįstamo teksto koordinates, puslapių numerių aptikimą, konkrečių dominančių sričių nustatymą ir daug daugiau.

OcrSpace Ruby biblioteka yra Ocr.Space OCR API įvyniojimas, kuris siūlo patikimą ir tikslų teksto ištraukimą iš vaizdų ir PDF dokumentų. Ši biblioteka, sukurta specialiai Ruby kūrėjams, supaprastina integravimo procesą, todėl programuotojai gali greitai įtraukti OCR funkcijas į savo programas, nesusidurdami su pagrindinės API sudėtingumu. Nesvarbu, ar kuriate dokumentų valdymo sistemą, automatizuojate duomenų išgavimą ar gerinate prieinamumą, „OcrSpace Ruby“ biblioteka yra neįkainojamas įrankis, kuris supaprastina OCR procesą ir suteikia jūsų programoms tikslių teksto ištraukimo galimybių.

Previous Next

Darbo su OcrSpace pradžia

Rekomenduojamas būdas įdiegti „OcrSpace“ yra naudoti „Rubygems“. Norėdami sklandžiai įdiegti, naudokite šią komandą.

Įdiekite „OcrSpace“ naudodami „Rubygems“

$ gem install ocr_space 

Sukompiliuotą bendrinamą biblioteką galite atsisiųsti iš Github saugyklos.

Konvertuokite vaizdus iš URL į tekstą naudodami Ruby API

Atvirojo kodo OcrSpace bibliotekoje yra keletas galingų funkcijų, skirtų įkelti įvairių tipų vaizdus ir konvertuoti juos į tekstą, naudojant kelias Ruby kodo eilutes. Biblioteka palaiko įvairias OCR parinktis, įskaitant teksto ištraukimą iš vaizdų, nuskaitytų dokumentų ir PDF failų. Nesvarbu, ar programinės įrangos kūrėjams reikia apdoroti sąskaitas faktūras, kvitus ar bet kokio kito tipo dokumentus, „OcrSpace Ruby“ biblioteka gali tai veiksmingai tvarkyti. Šiame pavyzdyje parodyta, kaip programinės įrangos kūrėjai gali konvertuoti vaizdus į tekstą naudodami URL naudodami Ruby API.

Konvertuokite vaizdus iš URL naudodami Ruby API

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Išplėstinės OCR galimybės per Ruby API

Atvirojo kodo OcrSpace bibliotekoje yra keletas labai naudingų ir pažangių funkcijų, skirtų OCR operacijoms atlikti Ruby programose. Jis gali tiksliai atpažinti tekstą iš mažos skyros vaizdų, iškraipyto teksto ir net ranka rašyto turinio, užtikrindamas patikimus rezultatus įvairiuose scenarijuose. Be teksto ištraukimo, biblioteka taip pat leidžia kūrėjams iš dokumentų išgauti kitą svarbią informaciją. Tai apima atpažinto teksto koordinačių gavimą, puslapių numerių aptikimą ir konkrečių dominančių sričių nustatymą dokumente.

Kaip ištraukti tekstą iš įkelto failo naudojant Ruby API?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result
 Lietuvių