1. Tuotteet
  2.   OCR
  3.   Ruby
  4.   OcrSpace
 
  

Avoimen lähdekoodin Ruby-kirjasto muuntaa kuvat tekstiksi verkossa

Ilmainen Ruby Optical Character Recognition (OCR) -kirjasto antaa ohjelmistokehittäjille mahdollisuuden ladata, lukea ja muuntaa kuvia, PDF-tiedostoja tai skannattuja asiakirjoja tekstiksi tai haettavissa oleviksi asiakirjoiksi

Optical Character Recognition (OCR) -tekniikka on edistynyt merkittävästi viime vuosina, mikä helpottaa tietojen poiminta eri lähteistä. Se mahdollistaa automatisoinnin, parantaa tietojen saatavuutta ja lisää tuottavuutta eri aloilla. Yksi tällainen tehokas työkalu on OcrSpace Ruby -kirjasto, joka tarjoaa kehittäjille suoraviivaisen ratkaisun OCR-ominaisuuksien integroimiseen Ruby-sovelluksiin. Tämä kirjasto yksinkertaistaa tekstin poimimista kuvista, skannatuista asiakirjoista ja PDF-tiedostoista, joten se on erinomainen valinta kehittäjille, jotka etsivät kätevää tekstintunnistusratkaisua.

OcrSpace Ruby -kirjasto tarjoaa suoraviivaisen ja intuitiivisen käyttöliittymän, jonka avulla OCR-ominaisuudet on helppo integroida Ruby-sovelluksiin. Kirjastossa on useita tärkeitä ominaisuuksia, kuten erityyppisten kuvien lataaminen, tekstin poimiminen kuvista, skannattujen asiakirjojen muuntaminen tekstiksi, tekstin poimiminen useilla kielillä kirjoitetuista asiakirjoista, tekstin tunnistaminen matalaresoluutioisista kuvista, käsin kirjoitetun sisällön käsittely , noutaa tunnistetun tekstin koordinaatit, havaita sivunumerot, tunnistaa tietyt kiinnostavat alueet ja paljon muuta.

OcrSpace Ruby -kirjasto on Ocr.Space OCR API -sovellusliittymä, joka tarjoaa luotettavan ja tarkan tekstin poimimisen kuvista ja PDF-dokumenteista. Tämä erityisesti Ruby-kehittäjille suunniteltu kirjasto yksinkertaistaa integrointiprosessia, jolloin ohjelmoijat voivat nopeasti sisällyttää OCR-toiminnot sovelluksiinsa ilman, että he joutuvat käsittelemään taustalla olevan API:n monimutkaisuutta. Olitpa rakentamassa asiakirjanhallintajärjestelmää, automatisoimassa tietojen poiminta tai parantamassa saavutettavuutta, OcrSpace Ruby -kirjasto on korvaamaton työkalu, joka virtaviivaistaa OCR-prosessia ja antaa sovelluksille tarkat tekstinpoistoominaisuudet.

Previous Next

OcrSpacen käytön aloittaminen

Suositeltava tapa asentaa OcrSpace on käyttää Rubygemejä. Käytä seuraavaa komentoa sujuvaan asennukseen.

Asenna OcrSpace Rubygemsin kautta

$ gem install ocr_space 

Voit ladata kootun jaetun kirjaston Githubin-arkistosta.

Muunna kuvat URL-osoitteesta tekstiksi Ruby API:n kautta

Avoimen lähdekoodin OcrSpace-kirjastossa on joitain tehokkaita ominaisuuksia erityyppisten kuvien lataamiseen ja niiden muuntamiseen tekstiksi parilla Ruby-koodirivillä. Kirjasto tukee erilaisia OCR-vaihtoehtoja, mukaan lukien tekstin poimiminen kuvista, skannatuista asiakirjoista ja PDF-tiedostoista. Olipa ohjelmistokehittäjien tarpeen käsitellä laskuja, kuitteja tai muita asiakirjoja, OcrSpace Ruby -kirjasto pystyy käsittelemään niitä tehokkaasti. Seuraava esimerkki näyttää, kuinka ohjelmistokehittäjät voivat muuntaa kuvat tekstiksi URL-osoitteen kautta Ruby API:n avulla.

Muunna kuvat URL-osoitteesta Ruby API:n kautta

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

OCR:n lisäominaisuudet Ruby APIn kautta

Avoimen lähdekoodin OcrSpace-kirjasto sisältää erittäin hyödyllisiä ja edistyneitä ominaisuuksia Ruby-sovellusten tekstintunnistustoimintojen käsittelemiseen. Se tunnistaa tarkasti tekstin matalaresoluutioisista kuvista, vääristyneestä tekstistä ja jopa käsinkirjoitetusta sisällöstä, mikä varmistaa luotettavat tulokset eri skenaarioissa. Tekstin purkamisen lisäksi kirjaston avulla kehittäjät voivat poimia asiakirjoista myös muita tärkeitä tietoja. Tämä sisältää tunnistetun tekstin koordinaattien hakemisen, sivunumeroiden tunnistamisen ja tiettyjen kiinnostavien alueiden tunnistamisen asiakirjassa.

Kuinka purkaa tekstiä ladatusta tiedostosta Ruby API:n kautta?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result
 Suomen