Biblioteca Ruby de código abierto para convertir imágenes a texto en línea.

La biblioteca gratuita de reconocimiento óptico de caracteres (OCR) de Ruby permite a los desarrolladores de software cargar, leer y convertir imágenes, archivos PDF o documentos escaneados en texto o documentos con capacidad de búsqueda.

La tecnología de reconocimiento óptico de caracteres (OCR) ha logrado avances significativos en los últimos años, lo que facilita la automatización de la extracción de datos de diversas fuentes. Permite la automatización, mejora la accesibilidad a los datos y mejora la productividad en diversos dominios. Una de esas poderosas herramientas es la biblioteca OcrSpace Ruby, que proporciona a los desarrolladores una solución sencilla para integrar capacidades de OCR en sus aplicaciones Ruby. Esta biblioteca simplifica el proceso de extracción de texto de imágenes, documentos escaneados y archivos PDF, lo que la convierte en una excelente opción para los desarrolladores que buscan una solución OCR conveniente.

La biblioteca OcrSpace Ruby ofrece una interfaz sencilla e intuitiva, lo que facilita la integración de capacidades de OCR en aplicaciones Ruby. Hay varias características importantes que forman parte de la biblioteca, como cargar varios tipos de imágenes, extraer texto de imágenes, convertir documentos escaneados en texto, extraer texto de documentos escritos en varios idiomas, reconocer texto de imágenes de baja resolución y trabajar con contenido escrito a mano. , recuperando coordenadas del texto reconocido, detectando números de página, identificando áreas de interés específicas y mucho más.

La biblioteca OcrSpace Ruby es un contenedor de la API Ocr.Space OCR, que ofrece extracción de texto confiable y precisa a partir de imágenes y documentos PDF. Creada específicamente para desarrolladores de Ruby, esta biblioteca simplifica el proceso de integración, permitiendo a los programadores incorporar rápidamente la funcionalidad OCR en sus aplicaciones sin tener que lidiar con las complejidades de la API subyacente. Ya sea que esté creando un sistema de gestión de documentos, automatizando la extracción de datos o mejorando la accesibilidad, la biblioteca OcrSpace Ruby es una herramienta invaluable que agiliza el proceso de OCR y brinda a sus aplicaciones capacidades de extracción de texto precisas.

De un vistazo

Una descripción general de las funciones de OcrSpace.

Descripción de las características

Realizar OCR
Agregar capacidades de OCR
Reconocer texto de imagen
Cargar imágenes a través de URL
Convertir PDF a texto
Texto de fuente reconocido
Buscar PDF
Otros idiomas
Crear aplicaciones de OCR
Guardar en el navegador
Extraer texto
Soporte multiproceso

OcrSpace

OcrSpace admite los formatos de archivos de compresión populares que se enumeran a continuación.

Lector

PNG, JPEG, BMP, TIFF, TGA, DICOM

Escritor

PNG, JPEG, BMP, TIFF

OcrSpace

Independencia de plataforma

OcrSpace solo requiere Ruby Runtime.

Ruby 5.1 y superior.

OcrSpace

Introducción a OcrSpace

La forma recomendada de instalar OcrSpace es utilizando Rubygems. Utilice el siguiente comando para una instalación sin problemas.

Instalar OcrSpace mediante Rubygems

$ gem install ocr_space

Puedes descargar la biblioteca compartida compilada desde el repositorio Github.

Convertir imágenes de URL a texto mediante Ruby API

La biblioteca de código abierto OcrSpace ha incluido algunas funciones potentes para cargar varios tipos de imágenes y convertirlas en texto con un par de líneas de código Ruby. La biblioteca admite varias opciones de OCR, incluida la extracción de texto de imágenes, documentos escaneados y archivos PDF. Ya sea que los desarrolladores de software necesiten procesar facturas, recibos o cualquier otro tipo de documento, la biblioteca OcrSpace Ruby puede manejarlo de manera eficiente. El siguiente ejemplo muestra cómo los desarrolladores de software pueden convertir imágenes en texto a través de URL utilizando Ruby API.

Convertir imágenes desde URL a través de Ruby API

result = resource.convert url: "http://bit.ly/2ih9aXt"

puts result
=>  #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]

result = resource.clean_convert url: "http://bit.ly/2ih9aXt"

puts result

=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES

Capacidades avanzadas de OCR a través de Ruby API

La biblioteca OcrSpace de código abierto ha incluido algunas funciones muy útiles y avanzadas para manejar operaciones de OCR dentro de aplicaciones Ruby. Puede reconocer con precisión texto a partir de imágenes de baja resolución, texto distorsionado e incluso contenido escrito a mano, lo que garantiza resultados confiables en diversos escenarios. Además de la extracción de texto, la biblioteca también permite a los desarrolladores extraer otra información importante de los documentos. Esto incluye recuperar coordenadas del texto reconocido, detectar números de página e identificar áreas de interés específicas dentro del documento.

¿Cómo extraer texto de un archivo cargado a través de Ruby API?

result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result #Raw result

=>  #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}

result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"

puts result