Biblioteca Ruby avanzada y gratuita para cargar y extraer texto de imágenes

Una API Ruby OCR de código abierto líder y un conversor de imágenes a texto que permite a los desarrolladores de software cargar, reconocer y extraer texto de imágenes (imágenes escaneadas y archivos PDF)

El reconocimiento óptico de caracteres (OCR) es una poderosa tecnología que permite a las computadoras reconocer y extraer texto de imágenes o documentos escaneados. Tiene numerosas aplicaciones, que van desde la digitalización de materiales impresos hasta la automatización de procesos de entrada de datos. En el lenguaje de programación Ruby, una biblioteca popular para OCR es Ruby-Tesseract-OCR. Ruby-Tesseract-OCR es una gema Ruby que sirve como contenedor para el motor Tesseract OCR. Tesseract es un motor OCR de código abierto desarrollado por Google y es reconocido por su precisión y compatibilidad con idiomas.

Ruby-Tesseract-OCR va más allá de las capacidades básicas de OCR y ofrece funciones adicionales para casos de uso avanzados. Por ejemplo, los desarrolladores de software pueden especificar una región de interés (ROI) dentro de una imagen para limitar el análisis de OCR a un área específica. Esto es particularmente útil cuando se trata de documentos complejos o cuando sólo necesita extraer texto de una sección específica. La biblioteca proporciona varias funciones adicionales para mejorar las capacidades de OCR, como cargar una imagen existente, extraer texto de imágenes o documentos escaneados, obtener resultados HOCR (HTML OCR) y muchas más.

La gema Ruby-Tesseract-OCR proporciona una interfaz fácil de usar para interactuar con el motor Tesseract, lo que permite a los desarrolladores de Ruby integrar capacidades de OCR en sus proyectos sin esfuerzo. Ya sea que necesite extraer información de facturas, digitalizar materiales impresos o automatizar tareas de ingreso de datos, la biblioteca de código abierto proporciona una solución confiable y eficiente. Pruébelo y libere el potencial del OCR en sus proyectos Ruby hoy.

De un vistazo

Una descripción general de las funciones de Ruby-Tesseract-OCR.

Descripción de las características

Realizar OCR
Agregar capacidades de OCR
Reconocer texto de imagen
Cargar imágenes a través de URL
Convertir PDF a texto
Texto de fuente reconocido
Buscar PDF
Otros idiomas
Crear aplicaciones de OCR
Guardar en el navegador
Extraer texto
Soporte multiproceso

Ruby-Tesseract-OCR

Ruby-Tesseract-OCR admite los formatos de archivos OCR populares que se enumeran a continuación.

Lector

PNG, JPEG, BMP, TIFF, TGA, DICOM

Escritor

PNG, JPEG, BMP, TIFF

Ruby-Tesseract-OCR

Independencia de plataforma

Ruby-Tesseract-OCR solo requiere Ruby Runtime.

Ruby 5.1 y superior.

Ruby-Tesseract-OCR

Comenzando con Ruby-Tesseract-OCR

La forma recomendada de instalar Ruby-Tesseract-OCR es utilizando Rubygems. Utilice el siguiente comando para una instalación sin problemas.

Instalar Ruby-Tesseract-OCR mediante Rubygems

gem install tesseract-ocr

Puedes descargar la biblioteca compartida compilada desde el repositorio Github.

Extraer texto de imágenes y documentos escaneados mediante Ruby

Ruby-Tesseract-OCR es una biblioteca de código abierto muy poderosa que permite a los desarrolladores de software cargar y extraer texto de varios tipos de imágenes con solo un par de líneas de código Ruby. La biblioteca facilita la extracción de texto de imágenes, PDFS o documentos escaneados. El flujo de trabajo típico implica cargar una imagen, configurar los parámetros de OCR e invocar el motor de OCR para reconocer el texto. Para que la operación sea exitosa, los desarrolladores deben proporcionar la ruta a la imagen que desean procesar y llamar al método text_for para extraer el texto. Finalmente, el resultado se imprimirá en la consola. La biblioteca ofrece varias opciones de configuración para controlar el comportamiento de OCR, como el modo de segmentación de páginas, caracteres de la lista blanca y más. Los siguientes ejemplos muestran cómo los desarrolladores de software pueden cargar una imagen JPEG y extraer texto de ella dentro de aplicaciones Ruby.

¿Cómo extraer texto de imágenes usando comandos de Ruby?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

Extraer texto de un área de imagen particular mediante Ruby

La biblioteca de código abierto Ruby-Tesseract-OCR va más allá de las capacidades básicas de OCR y ofrece funciones adicionales para casos de uso avanzados. Por ejemplo, los usuarios pueden especificar una región de interés (ROI) dentro de una imagen para limitar el análisis de OCR a un área específica. Esto es particularmente útil cuando se trata de documentos complejos o cuando los usuarios sólo necesitan extraer texto de una sección específica. Además, la biblioteca proporciona métodos para obtener resultados HOCR (HTML OCR), que incluyen no solo el texto reconocido sino también información sobre el diseño y las coordenadas de los elementos del texto. La salida HOCR es útil cuando necesita datos más granulares o desea realizar análisis más detallados en la estructura del texto.

¿Cómo realizar hOCR en una imagen a través de la biblioteca Ruby?

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')