Aspose.OCR para Python vía .NET

Leer y Extraer Texto de Imágenes mediante la API de Python

La principal y potente API OCR para Python permite a los desarrolladores leer y extraer texto de imágenes, fotos, capturas de pantalla, documentos escaneados y archivos PDF.

En la era digital actual, convertir imágenes en formatos de texto editables se ha convertido en una tarea vital para muchas empresas y desarrolladores. Aspose.OCR for Python via .NET proporciona una solución robusta para el Reconocimiento Óptico de Caracteres (OCR) que permite a los desarrolladores de software extraer texto de imágenes sin esfuerzo. Aspose.OCR for Python via .NET es una biblioteca poderosa diseñada para tareas de OCR. Forma parte de la suite de productos Aspose, conocida por ofrecer herramientas de procesamiento de documentos de alta calidad. Esta biblioteca permite a los desarrolladores aprovechar las capacidades del framework .NET mientras programan en Python, habilitando así aplicaciones multiplataforma que pueden realizar operaciones de OCR de forma fluida. Soporta el reconocimiento de texto en más de 100 idiomas, incluidos inglés, español, francés, alemán, italiano, chino, japonés y muchos más.

Aspose.OCR for Python via .NET es una biblioteca OCR basada en .NET que permite a los desarrolladores reconocer y extraer texto de varios formatos de imagen, incluidos JPEG, PNG, GIF, BMP y TIFF. La API utiliza algoritmos avanzados para garantizar alta precisión en el reconocimiento de texto a partir de diversos formatos de imagen. Soporta el reconocimiento de texto en diferentes fuentes y estilos. Para mejorar la precisión del reconocimiento, Aspose.OCR ofrece capacidades de preprocesamiento como binarización, corrección de inclinación y eliminación de ruido. Esto ayuda a preparar las imágenes para obtener mejores resultados de OCR. Puede manejar múltiples imágenes en un solo proceso, permitiendo el procesamiento por lotes y ahorrando tiempo en escenarios donde se deben procesar grandes volúmenes de imágenes. Con sus funciones avanzadas, que incluyen soporte multilingüe, preprocesamiento de imágenes, análisis de diseño y manejo de errores, Aspose.OCR es una opción ideal para desarrolladores de software que deseen trabajar en proyectos basados en OCR.

A primera vista

Una visión general de las características de Aspose.OCR para Python vía .NET.

Resumen de características

Realizar OCR
Agregar capacidades OCR
Reconocer texto de imagen
Convertir imágenes de texto
Texto de fuente reconocido
Buscar en PDF
27 idiomas de reconocimiento
Crear aplicaciones OCR
Guardar en el navegador
Extraer texto
Soporte multihilo

Resumen de características

Reconocer imagen rotada
Filtros de preprocesamiento
PDF a imágenes
Reconoce caracteres chinos
Detecta tipografías populares
Procesa la imagen completa
Soporte de imágenes rotadas
Reconocimiento por lotes
Corrector ortográfico integrado
Dividir PDF
PDF a Excel
PDF a SVG

Aspose.OCR para Python vía .NET

La API admite principalmente el formato PDF pero puede exportar documentos PDF a varios otros formatos.

Lector

PDF, PDF/A, TEX, XPS, SVG

Escritor

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR para Python vía .NET

Independencia de plataforma

Aspose.OCR para Python vía .NET puede trabajar con cualquier lenguaje de programación basado en Python.

Python 3.6 y superiores.

Aspose.OCR para Python vía .NET

Comenzando con Aspose.OCR para Python vía .NET

La forma recomendada de instalar Aspose.OCR para Python vía .NET es usando pip. Por favor, use el siguiente comando para una instalación sin problemas.

Instalar Aspose.OCR para Python vía .NET mediante pip

 pip install aspose-ocr-python-net

Puede descargar el SDK directamente desde la página del producto Aspose.OCR Python Cloud SDK

Operaciones OCR con alta precisión mediante Python

Aspose.OCR para Python vía .NET está diseñada para alta precisión y exactitud. La biblioteca incorpora modelos avanzados de aprendizaje automático que mejoran la precisión de extracción de texto, incluso con imágenes inclinadas o de baja resolución. Esta característica la hace adecuada para aplicaciones que requieren reconocimiento de texto fiable, como la extracción automática de datos de formularios o documentos escaneados. El siguiente fragmento de código muestra una implementación simple donde se carga una imagen, se procesa y se muestra el texto reconocido.

¿Cómo cargar imágenes, realizar OCR y extraer texto mediante la API de Python?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Capacidades de preprocesamiento de imágenes

La biblioteca Aspose.OCR para Python vía .NET proporciona potentes funciones de preprocesamiento de imágenes dentro de aplicaciones Python. Estas funciones mejoran la precisión del OCR, como la corrección de inclinación, eliminación de ruido y normalización de la imagen. Estos pasos de preprocesamiento son cruciales cuando se trabaja con imágenes que pueden haber sido escaneadas en condiciones subóptimas. El siguiente ejemplo muestra cómo los desarrolladores pueden ejecutar la operación de corrección de inclinación, lo que garantiza que el texto se detecte con precisión, incluso si la imagen está ligeramente inclinada o no está perfectamente alineada.

¿Cómo realizar una operación OCR con corrección de inclinación dentro de aplicaciones Python?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Reconocimiento de texto manuscrito mediante Python

Aspose.OCR para Python vía .NET es muy fácil de usar y puede reconocer tanto texto impreso como manuscrito con solo un par de líneas de código Python. Esta característica es muy útil para aplicaciones como la digitalización de notas manuscritas o firmas. La capacidad del software para interpretar varios estilos de texto aumenta su utilidad en sectores como la educación y la documentación legal. A continuación se muestra un ejemplo que ilustra cómo realizar reconocimiento de texto manuscrito usando código Python.

¿Cómo realizar reconocimiento de texto manuscrito mediante la biblioteca Python?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Regiones de imagen personalizadas OCR en aplicaciones Python

Aspose.OCR para Python vía .NET ha proporcionado soporte completo para reconocer texto de un área específica de una imagen dentro de aplicaciones Python. Los desarrolladores pueden especificar regiones concretas dentro de una imagen para OCR, lo que resulta útil en escenarios donde solo una parte de la imagen contiene texto relevante. Los desarrolladores pueden definir regiones personalizadas para OCR en una imagen, establecer modos de reconocimiento y ajustar otros parámetros para optimizar el proceso de OCR según los requisitos específicos de la aplicación. A continuación se muestra un ejemplo que ilustra cómo los desarrolladores pueden reconocer una única línea de texto con solo un par de líneas de código Python.

¿Cómo reconocer una única línea de texto en una imagen mediante aplicaciones Python?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)