Open Source Ruby Library til at konvertere billeder til tekst online
Gratis Ruby Optical Character Recognition (OCR) bibliotek gør det muligt for softwareudviklere at indlæse, læse og konvertere billeder, PDF'er eller scannede dokumenter til tekst eller søgbare dokumenter
Optical Character Recognition (OCR) teknologi har gjort betydelige fremskridt i de seneste år, hvilket gør det nemmere at automatisere dataudtræk fra forskellige kilder. Det muliggør automatisering, forbedrer datatilgængelighed og forbedrer produktiviteten på forskellige domæner. Et sådant kraftfuldt værktøj er OcrSpace Ruby-biblioteket, som giver udviklere en ligetil løsning til at integrere OCR-funktioner i deres Ruby-applikationer. Dette bibliotek forenkler processen med at udtrække tekst fra billeder, scannede dokumenter og PDF-filer, hvilket gør det til et fremragende valg for udviklere, der søger en praktisk OCR-løsning.
OcrSpace Ruby-biblioteket tilbyder en ligetil og intuitiv grænseflade, der gør det nemt at integrere OCR-funktioner i Ruby-applikationer. Der er flere vigtige funktioner i biblioteket, såsom at indlæse forskellige typer billeder, udtrække tekst fra billeder, konvertere scannede dokumenter til tekst, udtrække tekst fra dokumenter skrevet på flere sprog, genkende tekst fra billeder i lav opløsning, arbejde med håndskrevet indhold , hentning af koordinater for den genkendte tekst, registrering af sidetal, identifikation af specifikke interesseområder og mange flere.
OcrSpace Ruby-biblioteket er en indpakning omkring Ocr.Space OCR API, som tilbyder pålidelig og nøjagtig tekstudtrækning fra billeder og PDF-dokumenter. Dette bibliotek er bygget specielt til Ruby-udviklere og forenkler integrationsprocessen, hvilket giver programmører mulighed for hurtigt at inkorporere OCR-funktionalitet i deres applikationer uden at beskæftige sig med kompleksiteten af den underliggende API. Uanset om du bygger et dokumentstyringssystem, automatiserer dataudtræk eller forbedrer tilgængeligheden, er OcrSpace Ruby-biblioteket et uvurderligt værktøj, der strømliner OCR-processen og giver dine applikationer præcise tekstudtræksfunktioner.
Kom godt i gang med OcrSpace
Den anbefalede måde at installere OcrSpace på er at bruge Rubygems. Brug venligst følgende kommando for en problemfri installation.
Installer OcrSpace via Rubygems
$ gem install ocr_space
Du kan downloade det kompilerede delte bibliotek fra Github-lageret.
Konverter billeder fra URL til tekst via Ruby API
Open source OcrSpace-biblioteket har inkluderet nogle kraftfulde funktioner til at indlæse forskellige typer billeder og konvertere dem til tekst med et par linjer Ruby-kode. Biblioteket understøtter forskellige OCR-indstillinger, herunder udtrækning af tekst fra billeder, scannede dokumenter og PDF-filer. Uanset om softwareudviklere skal behandle fakturaer, kvitteringer eller andre typer dokumenter, kan OcrSpace Ruby-biblioteket håndtere det effektivt. Følgende eksempel viser, hvordan softwareudviklere kan konvertere billeder til tekst via URL ved hjælp af Ruby API.
Konverter billeder fra URL via Ruby API
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
Avancerede OCR-funktioner via Ruby API
Open source OcrSpace-biblioteket har inkluderet nogle meget nyttige og avancerede funktioner til håndtering af OCR-operationer i Ruby-applikationer. Den kan nøjagtigt genkende tekst fra billeder i lav opløsning, forvrænget tekst og endda håndskrevet indhold, hvilket sikrer pålidelige resultater på tværs af forskellige scenarier. Udover tekstudtrækning giver biblioteket også udviklere mulighed for at udtrække andre vigtige oplysninger fra dokumenter. Dette omfatter hentning af koordinater for den genkendte tekst, registrering af sidetal og identifikation af specifikke interesseområder i dokumentet.
sHvordan udtrækkes tekst fra en uploadet fil via Ruby API?
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result