1. Produkter
  2.   OCR
  3.   Ruby
  4.   Ruby-Tesseract-OCR
 
  

Avanceret gratis Ruby-bibliotek til at indlæse og udtrække tekst fra billeder

En førende Open Source Ruby OCR API & Image to Text Converter, der giver softwareudviklere mulighed for at indlæse, genkende og udtrække tekst fra billeder (scannede billeder og PDF-filer)

Optical Character Recognition (OCR) er en kraftfuld teknologi, der gør det muligt for computere at genkende og udtrække tekst fra billeder eller scannede dokumenter. Det har adskillige applikationer, lige fra digitalisering af trykte materialer til automatisering af dataindtastningsprocesser. I Ruby-programmeringssproget er et populært bibliotek til OCR Ruby-Tesseract-OCR. Ruby-Tesseract-OCR er en Ruby-perle, der tjener som indpakning til Tesseract OCR-motoren. Tesseract er en Open Source OCR-motor udviklet af Google og er kendt for sin nøjagtighed og sprogunderstøttelse.

Ruby-Tesseract-OCR går ud over de grundlæggende OCR-funktioner og tilbyder yderligere funktioner til avancerede brugssager. For eksempel kan softwareudviklere angive et område af interesse (ROI) i et billede for at begrænse OCR-analysen til et specifikt område. Dette er især nyttigt, når du har at gøre med komplekse dokumenter, eller når du kun skal udtrække tekst fra en bestemt sektion. Biblioteket tilbyder adskillige ekstra funktioner til at forbedre OCR-funktionerne, såsom indlæsning af et eksisterende billede, udtrækning af tekst fra billeder eller scannede dokumenter, opnåelse af HOCR (HTML OCR) output og mange flere.

Ruby-Tesseract-OCR-perlen giver en brugervenlig grænseflade til at interagere med Tesseract-motoren, hvilket gør det muligt for Ruby-udviklere at integrere OCR-funktioner i deres projekter uden besvær. Uanset om du har brug for at udtrække oplysninger fra fakturaer, digitalisere trykte materialer eller automatisere dataindtastningsopgaver, giver open source-biblioteket en pålidelig og effektiv løsning. Prøv det, og frigør potentialet ved OCR i dine Ruby-projekter i dag.

Previous Next

Kom godt i gang med Ruby-Tesseract-OCR

Den anbefalede måde at installere Ruby-Tesseract-OCR på er at bruge Rubygems. Brug venligst følgende kommando for en problemfri installation.

Installer Ruby-Tesseract-OCR via Rubygems

gem install tesseract-ocr 

Du kan downloade det kompilerede delte bibliotek fra Github-lageret.

Udtræk tekst fra billeder og scannede dokumenter via Ruby

Ruby-Tesseract-OCR er et meget kraftfuldt open source-bibliotek, der tillader softwareudviklere at indlæse og udtrække tekst fra forskellige typer billeder med blot et par linjer Ruby-kode. Biblioteket gør det nemt at udtrække tekst fra billeder, PDFS eller scannede dokumenter. Den typiske arbejdsgang involverer at indlæse et billede, konfigurere OCR-parametrene og kalde OCR-motoren for at genkende teksten. For en vellykket operation skal udviklere give stien til det billede, de vil behandle, og kalde text_for-metoden til at udtrække teksten. Til sidst vil resultatet blive printet til konsollen. Biblioteket tilbyder forskellige F-konfigurationsmuligheder til at kontrollere OCR-adfærd, såsom sidesegmenteringstilstand, hvidlistetegn og mere. Følgende eksempler viser, hvordan softwareudviklere kan indlæse et JPEG-billede og udtrække tekst fra det inde i Ruby-applikationer.

Hvordan udtrækkes tekst fra billeder ved hjælp af Ruby-kommandoer?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

Udtræk tekst fra et bestemt billedområde via Ruby

Open source Ruby-Tesseract-OCR-biblioteket går ud over de grundlæggende OCR-funktioner og tilbyder yderligere funktioner til avancerede brugssager. For eksempel kan brugere angive et område af interesse (ROI) i et billede for at begrænse OCR-analysen til et specifikt område. Dette er især nyttigt, når de håndterer komplekse dokumenter, eller når brugere kun skal udtrække tekst fra en bestemt sektion. Derudover giver biblioteket metoder til at opnå HOCR (HTML OCR) output, som ikke kun inkluderer den genkendte tekst, men også information om layoutet og koordinaterne for tekstelementerne. HOCR-output er nyttigt, når du har brug for mere granulære data eller ønsker at udføre yderligere analyse af tekststrukturen.

Hvordan udfører man hOCR på et billede via Ruby Library?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')
 Dansk