Avansert gratis Ruby-bibliotek for å laste inn og trekke ut tekst fra bilder
En ledende Open Source Ruby OCR API & Image to Text Converter som lar programvareutviklere laste inn, gjenkjenne og trekke ut tekst fra bilder (skannede bilder og PDF-filer)
Optical Character Recognition (OCR) er en kraftig teknologi som gjør det mulig for datamaskiner å gjenkjenne og trekke ut tekst fra bilder eller skannede dokumenter. Den har mange bruksområder, alt fra digitalisering av trykt materiale til automatisering av dataregistreringsprosesser. I programmeringsspråket Ruby er et populært bibliotek for OCR Ruby-Tesseract-OCR. Ruby-Tesseract-OCR er en Ruby-perle som fungerer som omslag for Tesseract OCR-motoren. Tesseract er en åpen kildekode OCR-motor utviklet av Google og er kjent for sin nøyaktighet og språkstøtte.
Ruby-Tesseract-OCR går utover grunnleggende OCR-funksjoner og tilbyr tilleggsfunksjoner for avansert bruk. Programvareutviklere kan for eksempel spesifisere et område av interesse (ROI) i et bilde for å begrense OCR-analysen til et spesifikt område. Dette er spesielt nyttig når du arbeider med komplekse dokumenter eller når du bare trenger å trekke ut tekst fra en bestemt del. Biblioteket tilbyr flere tilleggsfunksjoner for å forbedre OCR-funksjonene, for eksempel å laste inn et eksisterende bilde, trekke ut tekst fra bilder eller skannede dokumenter, skaffe HOCR (HTML OCR)-utdata og mange flere.
Ruby-Tesseract-OCR-perlen gir et brukervennlig grensesnitt for å samhandle med Tesseract-motoren, noe som gjør at Ruby-utviklere enkelt kan integrere OCR-funksjoner i prosjektene sine. Enten du trenger å trekke ut informasjon fra fakturaer, digitalisere trykt materiale eller automatisere dataregistreringsoppgaver, gir biblioteket med åpen kildekode en pålitelig og effektiv løsning. Prøv det, og lås opp potensialet til OCR i Ruby-prosjektene dine i dag.
Kom i gang med Ruby-Tesseract-OCR
Den anbefalte måten å installere Ruby-Tesseract-OCR på er å bruke Rubygems. Bruk følgende kommando for en jevn installasjon.
Installer Ruby-Tesseract-OCR via Rubygems
gem install tesseract-ocr
Du kan laste ned det kompilerte delte biblioteket fra Github-depotet.
trekk ut tekst fra bilder og skannede dokumenter via Ruby
Ruby-Tesseract-OCR er et veldig kraftig åpen kildekode-bibliotek som lar programvareutviklere laste inn og trekke ut tekst fra ulike typer bilder med bare et par linjer med Ruby-kode. Biblioteket gjør det enkelt å trekke ut tekst fra bilder, PDF-filer eller skannede dokumenter. Den typiske arbeidsflyten innebærer å laste et bilde, konfigurere OCR-parameterne og påkalle OCR-motoren for å gjenkjenne teksten. For en vellykket operasjon må utviklere gi stien til bildet de ønsker å behandle og kalle text_for-metoden for å trekke ut teksten. Til slutt vil resultatet bli skrevet ut til konsollen. Biblioteket tilbyr ulike Fconfiguration-alternativer for å kontrollere OCR-atferd, for eksempel sidesegmenteringsmodus, hvitelistetegn og mer. Følgende eksempler viser hvordan programvareutviklere kan laste et JPEG-bilde og trekke ut tekst fra det i Ruby-applikasjoner.
Hvordan trekke ut tekst fra bilder ved hjelp av Ruby-kommandoer?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
e.text_for('test/first.png').strip # => 'ABC'
trekk ut tekst fra et bestemt bildeområde via Ruby
Åpen kildekode Ruby-Tesseract-OCR-biblioteket går utover grunnleggende OCR-funksjoner og tilbyr tilleggsfunksjoner for avansert bruk. For eksempel kan brukere spesifisere et område av interesse (ROI) i et bilde for å begrense OCR-analysen til et spesifikt område. Dette er spesielt nyttig når du arbeider med komplekse dokumenter eller når brukere bare trenger å trekke ut tekst fra en bestemt del. I tillegg gir biblioteket metoder for å skaffe HOCR (HTML OCR)-utdata, som ikke bare inkluderer den gjenkjente teksten, men også informasjon om oppsettet og koordinatene til tekstelementene. HOCR-utdata er nyttig når du trenger mer granulære data eller ønsker å utføre ytterligere analyse av tekststrukturen.
Hvordan utfører jeg hOCR på et bilde via Ruby Library?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
puts e.hocr_for('test/first.png')