Open Source Ruby Library for å konvertere bilder til tekst online

Gratis Ruby Optical Character Recognition (OCR) bibliotek lar programvareutviklere laste inn, lese og konvertere bilder, PDF-er eller skannede dokumenter til tekst eller søkbare dokumenter

Optical Character Recognition (OCR)-teknologi har gjort betydelige fremskritt de siste årene, noe som gjør det enklere å automatisere datautvinning fra ulike kilder. Det muliggjør automatisering, forbedrer datatilgjengelighet og øker produktiviteten på ulike domener. Et så kraftig verktøy er OcrSpace Ruby-biblioteket, som gir utviklere en enkel løsning for å integrere OCR-funksjoner i Ruby-applikasjonene deres. Dette biblioteket forenkler prosessen med å trekke ut tekst fra bilder, skannede dokumenter og PDF-filer, noe som gjør det til et utmerket valg for utviklere som søker en praktisk OCR-løsning.

OcrSpace Ruby-biblioteket tilbyr et enkelt og intuitivt grensesnitt, som gjør det enkelt å integrere OCR-funksjoner i Ruby-applikasjoner. Det er flere viktige funksjoner i biblioteket, som å laste inn ulike typer bilder, trekke ut tekst fra bilder, konvertere skannede dokumenter til tekst, trekke ut tekst fra dokumenter skrevet på flere språk, gjenkjenne tekst fra bilder med lav oppløsning, arbeide med håndskrevet innhold , hente koordinater for den gjenkjente teksten, oppdage sidetall, identifisere spesifikke områder av interesse og mye mer.

OcrSpace Ruby-biblioteket er en innpakning rundt Ocr.Space OCR API, som tilbyr pålitelig og nøyaktig tekstutvinning fra bilder og PDF-dokumenter. Bygget spesielt for Ruby-utviklere, forenkler dette biblioteket integrasjonsprosessen, og lar programmerere raskt inkorporere OCR-funksjonalitet i applikasjonene sine uten å forholde seg til kompleksiteten til den underliggende API. Enten du bygger et dokumentbehandlingssystem, automatiserer datautvinning eller forbedrer tilgjengeligheten, er OcrSpace Ruby-biblioteket et uvurderlig verktøy som strømlinjeformer OCR-prosessen og gir programmene dine nøyaktige tekstuttrekkingsmuligheter.

Med et blikk

En oversikt over OcrSpace-funksjoner.

Oversikt over funksjoner

Utfør OCR
Legg til OCR-funksjoner
Gjenkjenne bildetekst
Last inn bilder via URL
Konverter PDF tp-tekst
Gjenkjent skrifttekst
Søk i PDF
Andre språk
Lag OCR-apper
Lagre i nettleseren
Trekk ut tekst
Støtte for flere tråder

OcrSpace

OcrSpace støtter populære komprimeringsfilformater oppført nedenfor.

Leser

PNG, JPEG, BMP, TIFF, TGA, DICOM

Forfatter

PNG, JPEG, BMP, TIFF

OcrSpace

Plattformuavhengighet

OcrSpace krever bare Ruby Runtime.

Ruby 5.1 og nyere.

OcrSpace

Kom i gang med OcrSpace

Den anbefalte måten å installere OcrSpace på er å bruke Rubygems. Bruk følgende kommando for en jevn installasjon.

Installer OcrSpace via Rubygems

$ gem install ocr_space

Du kan laste ned det kompilerte delte biblioteket fra Github-depotet.

Konverter bilder fra URL til tekst via Ruby API

Open source OcrSpace-biblioteket har inkludert noen kraftige funksjoner for å laste ulike typer bilder og konvertere dem til tekst med et par linjer med Ruby-kode. Biblioteket støtter ulike OCR-alternativer, inkludert å trekke ut tekst fra bilder, skannede dokumenter og PDF-filer. Enten programvareutviklere trenger å behandle fakturaer, kvitteringer eller andre typer dokumenter, kan OcrSpace Ruby-biblioteket håndtere det effektivt. Følgende eksempel viser hvordan programvareutviklere kan konvertere bilder til tekst via URL ved hjelp av Ruby API.

Konverter bilder fra URL via Ruby API

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Avanserte OCR-funksjoner via Ruby API

Open source OcrSpace-biblioteket har inkludert noen svært nyttige og avanserte funksjoner for å håndtere OCR-operasjoner i Ruby-applikasjoner. Den kan gjenkjenne tekst nøyaktig fra bilder med lav oppløsning, forvrengt tekst og til og med håndskrevet innhold, og sikrer pålitelige resultater på tvers av ulike scenarier. Bortsett fra tekstutvinning, lar biblioteket også utviklere trekke ut annen viktig informasjon fra dokumenter. Dette inkluderer å hente koordinater for den gjenkjente teksten, oppdage sidetall og identifisere spesifikke områder av interesse i dokumentet.

Hvordan trekker du ut tekst fra en opplastet fil via Ruby API?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result