Avancerat gratis Ruby-bibliotek för att ladda och extrahera text från bilder
En ledande Open Source Ruby OCR API & Image to Text Converter som låter mjukvaruutvecklare ladda, känna igen och extrahera text från bilder (skannade bilder och PDF-filer)
Optical Character Recognition (OCR) är en kraftfull teknik som gör det möjligt för datorer att känna igen och extrahera text från bilder eller skannade dokument. Det har många applikationer, allt från digitalisering av tryckt material till automatisering av datainmatningsprocesser. I programmeringsspråket Ruby är ett populärt bibliotek för OCR Ruby-Tesseract-OCR. Ruby-Tesseract-OCR är en Ruby-pärla som fungerar som omslag för Tesseract OCR-motorn. Tesseract är en OCR-motor med öppen källkod utvecklad av Google och är känd för sin noggrannhet och språkstöd.
Ruby-Tesseract-OCR går utöver grundläggande OCR-funktioner och erbjuder ytterligare funktioner för avancerade användningsfall. Till exempel kan mjukvaruutvecklare ange en region av intresse (ROI) i en bild för att begränsa OCR-analysen till ett specifikt område. Detta är särskilt användbart när du hanterar komplexa dokument eller när du bara behöver extrahera text från ett specifikt avsnitt. Biblioteket tillhandahåller flera ytterligare funktioner för att förbättra OCR-funktionerna, som att ladda en befintlig bild, extrahera text från bilder eller skannade dokument, erhålla HOCR (HTML OCR)-utdata och många fler.
Ruby-Tesseract-OCR-pärlan ger ett lättanvänt gränssnitt för att interagera med Tesseract-motorn, vilket gör det möjligt för Ruby-utvecklare att integrera OCR-funktioner i sina projekt utan ansträngning. Oavsett om du behöver extrahera information från fakturor, digitalisera tryckt material eller automatisera datainmatningsuppgifter, erbjuder biblioteket med öppen källkod en pålitlig och effektiv lösning. Ge det ett försök och lås upp potentialen för OCR i dina Ruby-projekt idag.
Komma igång med Ruby-Tesseract-OCR
Det rekommenderade sättet att installera Ruby-Tesseract-OCR är att använda Rubygems. Använd följande kommando för en smidig installation.
Installera Ruby-Tesseract-OCR via Rubygems
gem install tesseract-ocr
Du kan ladda ner det kompilerade delade biblioteket från Github-förrådet.
Extrahera text från bilder och skannade dokument via Ruby
Ruby-Tesseract-OCR är ett mycket kraftfullt bibliotek med öppen källkod som tillåter programutvecklare att ladda och extrahera text från olika typer av bilder med bara ett par rader Ruby-kod. Biblioteket gör det enkelt att extrahera text från bilder, PDFS eller skannade dokument. Det typiska arbetsflödet innefattar att ladda en bild, konfigurera OCR-parametrarna och anropa OCR-motorn för att känna igen texten. För en framgångsrik operation måste utvecklare tillhandahålla vägen till bilden de vill bearbeta och anropa text_for-metoden för att extrahera texten. Slutligen kommer resultatet att skrivas ut till konsolen. Biblioteket erbjuder olika Fconfiguration-alternativ för att kontrollera OCR-beteende, såsom sidsegmenteringsläge, vitlistastecken och mer. Följande exempel visar hur programutvecklare kan ladda en JPEG-bild och extrahera text från den i Ruby-applikationer.
Hur extraherar man text från bilder med hjälp av Ruby-kommandon?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
e.text_for('test/first.png').strip # => 'ABC'
Extrahera text från ett visst bildområde via Ruby
Öppen källkod Ruby-Tesseract-OCR-biblioteket går utöver grundläggande OCR-funktioner och erbjuder ytterligare funktioner för avancerade användningsfall. Användare kan till exempel ange en region av intresse (ROI) i en bild för att begränsa OCR-analysen till ett specifikt område. Detta är särskilt användbart när man hanterar komplexa dokument eller när användare bara behöver extrahera text från ett specifikt avsnitt. Dessutom tillhandahåller biblioteket metoder för att erhålla HOCR (HTML OCR)-utdata, som inte bara inkluderar den igenkända texten utan också information om layouten och koordinaterna för textelementen. HOCR-utdata är användbart när du behöver mer detaljerad data eller vill utföra ytterligare analys av textstrukturen.
Hur utför man hOCR på en bild via Ruby Library?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
puts e.hocr_for('test/first.png')