Biblioteca Ruby de código aberto para converter imagens em texto online

Biblioteca gratuita de reconhecimento óptico de caracteres (OCR) Ruby permite que desenvolvedores de software carreguem, leiam e convertam imagens, PDFs ou documentos digitalizados em texto ou documentos pesquisáveis

A tecnologia de reconhecimento óptico de caracteres (OCR) fez avanços significativos nos últimos anos, facilitando a automatização da extração de dados de diversas fontes. Ele permite a automação, melhora a acessibilidade aos dados e aumenta a produtividade em vários domínios. Uma dessas ferramentas poderosas é a biblioteca OcrSpace Ruby, que fornece aos desenvolvedores uma solução simples para integrar recursos de OCR em seus aplicativos Ruby. Esta biblioteca simplifica o processo de extração de texto de imagens, documentos digitalizados e arquivos PDF, tornando-a uma excelente opção para desenvolvedores que buscam uma solução de OCR conveniente.

A biblioteca OcrSpace Ruby oferece uma interface simples e intuitiva, facilitando a integração de recursos de OCR em aplicativos Ruby. Existem vários recursos importantes na biblioteca, como carregar vários tipos de imagens, extrair texto de imagens, converter documentos digitalizados em texto, extrair texto de documentos escritos em vários idiomas, reconhecer texto de imagens de baixa resolução, trabalhar com conteúdo manuscrito , recuperando coordenadas do texto reconhecido, detectando números de páginas, identificando áreas específicas de interesse e muito mais.

A biblioteca OcrSpace Ruby é um wrapper da API Ocr.Space OCR, que oferece extração de texto confiável e precisa de imagens e documentos PDF. Construída especificamente para desenvolvedores Ruby, esta biblioteca simplifica o processo de integração, permitindo que os programadores incorporem rapidamente a funcionalidade OCR em seus aplicativos sem lidar com as complexidades da API subjacente. Esteja você construindo um sistema de gerenciamento de documentos, automatizando a extração de dados ou aprimorando a acessibilidade, a biblioteca OcrSpace Ruby é uma ferramenta inestimável que agiliza o processo de OCR e capacita seus aplicativos com recursos precisos de extração de texto.

Resumo

Uma visão geral dos recursos do OcrSpace.

Visão geral dos recursos

Executar OCR
Adicionar recursos de OCR
Reconhecer o texto da imagem
Carregar imagens via URL
Converter PDF em texto
Texto de fonte reconhecida
Pesquisar PDF
Outros idiomas
Criar aplicativos de OCR
Salvar no navegador
Extrair texto
Suporte multithreading

OcrSpace

OcrSpace oferece suporte aos formatos de arquivo de compactação populares listados abaixo.

Leitor

PNG, JPEG, BMP, TIFF, TGA, DICOM

Escritor

PNG, JPEG, BMP, TIFF

OcrSpace

Independência de plataforma

OcrSpace requer apenas Ruby Runtime.

Ruby 5.1 e superior.

OcrSpace

Introdução ao OcrSpace

A maneira recomendada de instalar o OcrSpace é usando Rubygems. Use o seguinte comando para uma instalação tranquila.

Instale o OcrSpace via Rubygems

$ gem install ocr_space

Você pode baixar a biblioteca compartilhada compilada no repositório Github.

Converter imagens de URL em texto via Ruby API

A biblioteca de código aberto OcrSpace inclui alguns recursos poderosos para carregar vários tipos de imagens e convertê-las em texto com algumas linhas de código Ruby. A biblioteca oferece suporte a várias opções de OCR, incluindo extração de texto de imagens, documentos digitalizados e arquivos PDF. Quer os desenvolvedores de software precisem processar faturas, recibos ou qualquer outro tipo de documento, a biblioteca OcrSpace Ruby pode lidar com isso de forma eficiente. O exemplo a seguir mostra como os desenvolvedores de software podem converter imagens em texto via URL usando a API Ruby.

Converta imagens de URL via API Ruby

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Recursos avançados de OCR via API Ruby

A biblioteca de código aberto OcrSpace inclui alguns recursos muito úteis e avançados para lidar com operações de OCR dentro de aplicativos Ruby. Ele pode reconhecer com precisão texto de imagens de baixa resolução, texto distorcido e até mesmo conteúdo manuscrito, garantindo resultados confiáveis em vários cenários. Além da extração de texto, a biblioteca também permite aos desenvolvedores extrair outras informações importantes de documentos. Isso inclui a recuperação de coordenadas do texto reconhecido, a detecção de números de páginas e a identificação de áreas específicas de interesse no documento.

Como extrair texto de um arquivo enviado por meio da API Ruby?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result