1. Productos
  2.   OCR
  3.   Python
  4.   Aspose.OCR Cloud SDK for Python

Aspose.OCR Cloud SDK for Python

 
 

La mejor API de OCR de Python para leer y extraer texto de imágenes

Agregue funcionalidad de OCR a aplicaciones Python a través de la API de OCR. Permite leer y extraer texto de imágenes, fotos, capturas de pantalla, documentos escaneados y archivos PDF a través de la biblioteca OCR de Python.

Aspose.OCR Cloud SDK para Python es una solución de reconocimiento óptico de caracteres (OCR) avanzada y flexible que ayuda a los desarrolladores de software a crear aplicaciones de OCR sin dependencias externas. Permite a los desarrolladores de software leer y extraer texto de imágenes, fotografías, capturas de pantalla, documentos escaneados y archivos PDF en una gran cantidad de escrituras europeas, cirílicas y orientales, y arroja resultados en los formatos de documentos más populares. La API facilita a los desarrolladores agregar la funcionalidad OCR a casi cualquier dispositivo o plataforma, incluidos netbooks, mini PC o incluso teléfonos inteligentes básicos.

El SDK de nube Aspose.OCR para Python es sencillo y fácil de manejar. Proporciona una amplia gama de funciones que la convierten en una solución de OCR ideal para desarrolladores que trabajan con Python, como leer una imagen completa, leer un documento PDF escaneado, extraer texto de una región específica de la imagen, extraer datos de una imagen escaneada o fotografiada. recibo, obtener resultados de reconocimiento de PDF, extraer texto de tablas escaneadas o fotografiadas, convertir los resultados del reconocimiento en una voz humana natural y mucho más.

Aspose.OCR Cloud SDK para Python se basa en Aspose.OCR Cloud API y es un motor de OCR basado en la nube que admite 45 idiomas de reconocimiento, incluidos inglés, francés, alemán, español, chino, japonés, árabe y mucho mas. Al utilizar el SDK de OCR, los programadores de Python pueden integrar fácilmente la funcionalidad de OCR en sus aplicaciones de Python sin tener que preocuparse por las complejidades de la tecnología de OCR. El SDK proporciona una interfaz sencilla e intuitiva que permite a los usuarios cargar imágenes, realizar OCR y recuperar texto en tan solo unas pocas líneas de código. Si necesita agregar funcionalidad OCR a sus aplicaciones Python, definitivamente vale la pena echarle un vistazo al SDK de nube Aspose.OCR para Python.

Previous Next

Introducción a Aspose.OCR Cloud SDK para Python

La forma recomendada de instalar Aspose.OCR Cloud SDK para Python es mediante pip. Utilice el siguiente comando para una instalación sin problemas.

Instalar Aspose.OCR Cloud SDK para Python mediante pip

 pip install aspose-ocr-cloud

Puedes descargar el SDK directamente desde la página del producto Aspose.OCR Python Cloud SDK

Reconocimiento de imágenes mediante aplicaciones Python

Aspose.OCR Cloud SDK para Python permite a los desarrolladores de software realizar operaciones de OCR para lograr el reconocimiento de imágenes dentro de sus propias aplicaciones Python. La API es muy fácil de usar y el reconocimiento de imágenes se puede realizar desde cualquier plataforma con acceso a Internet. Puede utilizar fácilmente la API REST de OCR para seleccionar y enviar imágenes para su reconocimiento, obtener resultados y almacenarlos en cualquier formato de archivo compatible con solo un par de líneas de código. El siguiente ejemplo muestra cómo realizar la operación OCR en imágenes usando código Python.

Realizar OCR en una imagen dentro de aplicaciones Python

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

Extraer texto de archivos PDF mediante la API de Python

El formato de documento portátil (PDF) es uno de los formatos de archivo de documentos comerciales más populares del mundo y es un formato de archivo desarrollado por Adobe en 1992 para presentar documentos. Aspose.OCR Cloud SDK para Python ha incluido una característica muy poderosa para extraer texto de archivos PDF dentro de aplicaciones Python. Para realizar la tarea de manera sencilla, debe cargar el archivo PDF en el almacenamiento en la nube de Aspose y realizar el reconocimiento OCR en el archivo PDF cargado. El siguiente ejemplo muestra cómo los desarrolladores de software pueden extraer texto de un archivo PDF utilizando código Python.

¿Cómo extraer texto de un archivo PDF mediante la API de Python?

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

Convertir texto en voz mediante la API de Python

Aspose.OCR Cloud SDK para Python permite a los desarrolladores de software convertir texto a partir de imágenes sin instalar ningún software de terceros. Utilizando la API, los programadores pueden convertir los resultados del reconocimiento en una voz humana natural que se puede reproducir en segundo plano o descargar. El primer usuario debe enviar la imagen al servidor Aspose OCR Cloud y extraer texto de él y luego convertir el texto a voz utilizando la API de texto a voz de Aspose OCR Cloud. Después de la conversión exitosa, puede guardar el archivo de voz en el disco.

¿Cómo convertir texto a voz usando la API de Python?

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)

 Español