Open Source Ruby Library om afbeeldingen online naar tekst te converteren

Gratis Ruby Optical Character Recognition (OCR)-bibliotheek waarmee softwareontwikkelaars afbeeldingen, PDF's of gescande documenten kunnen laden, lezen en converteren naar tekst of doorzoekbare documenten

Optical Character Recognition (OCR)-technologie heeft de afgelopen jaren aanzienlijke vooruitgang geboekt, waardoor het eenvoudiger is geworden om gegevensextractie uit verschillende bronnen te automatiseren. Het maakt automatisering mogelijk, verbetert de toegankelijkheid van gegevens en verhoogt de productiviteit in verschillende domeinen. Eén zo'n krachtig hulpmiddel is de OcrSpace Ruby-bibliotheek, die ontwikkelaars een eenvoudige oplossing biedt voor het integreren van OCR-mogelijkheden in hun Ruby-applicaties. Deze bibliotheek vereenvoudigt het proces van het extraheren van tekst uit afbeeldingen, gescande documenten en PDF-bestanden, waardoor het een uitstekende keuze is voor ontwikkelaars die op zoek zijn naar een handige OCR-oplossing.

De OcrSpace Ruby-bibliotheek biedt een eenvoudige en intuïtieve interface, waardoor het eenvoudig is om OCR-mogelijkheden in Ruby-applicaties te integreren. Er zijn verschillende belangrijke functies in de bibliotheek, zoals het laden van verschillende soorten afbeeldingen, het extraheren van tekst uit afbeeldingen, het converteren van gescande documenten naar tekst, het extraheren van tekst uit documenten die in meerdere talen zijn geschreven, het herkennen van tekst uit afbeeldingen met een lage resolutie, het werken met handgeschreven inhoud , het ophalen van coördinaten van de herkende tekst, het detecteren van paginanummers, het identificeren van specifieke interessegebieden, en nog veel meer.

De OcrSpace Ruby-bibliotheek is een omhulsel rond de Ocr.Space OCR API, die betrouwbare en nauwkeurige tekstextractie uit afbeeldingen en PDF-documenten biedt. Deze bibliotheek is speciaal gebouwd voor Ruby-ontwikkelaars en vereenvoudigt het integratieproces, waardoor programmeurs snel OCR-functionaliteit in hun applicaties kunnen integreren zonder rekening te hoeven houden met de complexiteit van de onderliggende API. Of u nu een documentbeheersysteem bouwt, gegevensextractie automatiseert of de toegankelijkheid verbetert, de OcrSpace Ruby-bibliotheek is een hulpmiddel van onschatbare waarde dat het OCR-proces stroomlijnt en uw toepassingen voorziet van nauwkeurige mogelijkheden voor tekstextractie.

In één oogopslag

Een overzicht van de OcrSpace-functies.

Kenmerkenoverzicht

Voer OCR uit
Voeg OCR-mogelijkheden toe
Herken afbeeldingstekst
Afbeeldingen laden via URL
PDF-tp-tekst converteren
Herkende lettertypetekst
PDF zoeken
Andere talen
Maak OCR-apps
Opslaan in browser
Tekst extraheren
Ondersteuning voor meerdere threads

OcrSpace

OcrSpace ondersteunt de populaire compressiebestandsindelingen die hieronder worden vermeld.

Lezer

PNG, JPEG, BMP, TIFF, TGA, DICOM

auteur

PNG, JPEG, BMP, TIFF

OcrSpace

Platformonafhankelijkheid

OcrSpace vereist alleen Ruby Runtime.

Ruby 5.1 en hoger.

OcrSpace

Aan de slag met OcrSpace

De aanbevolen manier om OcrSpace te installeren is met behulp van Rubygems. Gebruik het volgende commando voor een vlotte installatie.

Installeer OcrSpace via Rubygems

$ gem install ocr_space

Je kunt de gecompileerde gedeelde bibliotheek downloaden van de Github repository.

Converteer afbeeldingen van URL naar tekst via Ruby API

De open source OcrSpace-bibliotheek bevat een aantal krachtige functies voor het laden van verschillende soorten afbeeldingen en deze met een paar regels Ruby-code naar tekst te converteren. De bibliotheek ondersteunt verschillende OCR-opties, waaronder het extraheren van tekst uit afbeeldingen, gescande documenten en PDF-bestanden. Of softwareontwikkelaars nu facturen, kwitanties of welk ander type document dan ook moeten verwerken, de OcrSpace Ruby-bibliotheek kan dit efficiënt afhandelen. Het volgende voorbeeld laat zien hoe softwareontwikkelaars afbeeldingen naar tekst kunnen converteren via een URL met behulp van de Ruby API.

Converteer afbeeldingen van URL via Ruby API

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Geavanceerde OCR-mogelijkheden via Ruby API

De open source OcrSpace-bibliotheek bevat een aantal zeer nuttige en geavanceerde functies voor het afhandelen van OCR-bewerkingen binnen Ruby-applicaties. Het kan nauwkeurig tekst herkennen uit afbeeldingen met een lage resolutie, vervormde tekst en zelfs handgeschreven inhoud, waardoor betrouwbare resultaten in verschillende scenario's worden gegarandeerd. Naast tekstextractie kunnen ontwikkelaars met de bibliotheek ook andere belangrijke informatie uit documenten halen. Dit omvat het ophalen van de coördinaten van de herkende tekst, het detecteren van paginanummers en het identificeren van specifieke interessegebieden binnen het document.

Hoe tekst uit een geüpload bestand extraheren via de Ruby API?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result