1. Des produits
  2.   OCR
  3.   Python
  4.   Aspose.OCR Cloud SDK for Python

Aspose.OCR Cloud SDK for Python

 
 

Meilleure API Python OCR pour lire et extraire le texte des images

Ajoutez la fonctionnalité OCR aux applications Python via l'API OCR. Il permet de lire et d'extraire du texte à partir d'images, de photos, de captures d'écran, de documents numérisés et de fichiers PDF via la bibliothèque Python OCR..

Aspose.OCR Cloud SDK pour Python est une solution de reconnaissance optique de caractères (OCR) avancée et flexible qui aide les développeurs de logiciels à créer des applications OCR sans aucune dépendance externe. Il permet aux développeurs de logiciels de lire et d'extraire du texte à partir d'images, de photos, de captures d'écran, de documents numérisés et de PDF dans un grand nombre d'écritures européennes, cyrilliques et orientales, renvoyant les résultats dans les formats de documents les plus courants. L'API permet aux développeurs d'ajouter facilement la fonctionnalité OCR à presque tous les appareils ou plates-formes, y compris les netbooks, les mini PC ou même les smartphones d'entrée de gamme.

Le SDK Aspose.OCR Cloud pour Python est simple et facile à gérer. Il offre un large éventail de fonctionnalités qui en font une solution OCR idéale pour les développeurs travaillant avec Python, telles que la lecture d'une image entière, la lecture d'un document PDF numérisé, l'extraction de texte d'une région spécifique de l'image, l'extraction de données d'un document numérisé ou photographié. reçu, récupération des résultats de reconnaissance PDF, extraction de texte à partir de tableaux numérisés ou photographiés, conversion des résultats de reconnaissance en une voix humaine naturelle, et bien d'autres encore.

Le SDK Aspose.OCR Cloud pour Python est construit sur l'API Aspose.OCR Cloud, un moteur OCR basé sur le cloud qui prend en charge 45 langues de reconnaissance, dont l'anglais, le français, l'allemand, l'espagnol, le chinois, le japonais, l'arabe et beaucoup plus. Grâce au SDK OCR, les programmeurs Python peuvent facilement intégrer la fonctionnalité OCR dans leurs applications Python sans avoir à se soucier des complexités de la technologie OCR. Le SDK fournit une interface simple et intuitive qui permet aux utilisateurs de télécharger des images, d'effectuer une OCR et de récupérer du texte en quelques lignes de code seulement. Si vous devez ajouter une fonctionnalité OCR à vos applications Python, le SDK Aspose.OCR Cloud pour Python vaut vraiment le détour.

Previous Next

Premiers pas avec le SDK Aspose.OCR Cloud pour Python

La méthode recommandée pour installer le SDK Aspose.OCR Cloud pour Python consiste à utiliser pip. Veuillez utiliser la commande suivante pour une installation fluide.

Installer le SDK Aspose.OCR Cloud pour Python via pip

 pip install aspose-ocr-cloud

Vous pouvez télécharger le SDK directement à partir de la page produit du SDK Aspose.OCR Python Cloud

Reconnaissance d'images à l'aide d'applications Python

Le SDK Aspose.OCR Cloud pour Python permet aux développeurs de logiciels d'effectuer des opérations OCR pour réaliser la reconnaissance d'images dans leurs propres applications Python. L'API est très simple à utiliser et la reconnaissance d'images peut être effectuée depuis n'importe quelle plateforme ayant accès à Internet. Vous pouvez facilement utiliser l'API OCR REST pour sélectionner et envoyer des images à reconnaître, récupérer les résultats et les stocker dans tous les formats de fichiers pris en charge avec seulement quelques lignes de code. L'exemple suivant montre comment effectuer une opération OCR sur des images à l'aide du code Python.

Effectuer l'OCR sur une image dans les applications Python

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

Extraire le texte des fichiers PDF via l'API Python

Portable Document Format (PDF) est l'un des formats de fichiers de documents commerciaux les plus populaires au monde. Il s'agit d'un format de fichier développé par Adobe en 1992 pour présenter des documents. Aspose.OCR Cloud SDK pour Python inclut une fonctionnalité très puissante pour extraire du texte à partir de fichiers PDF dans des applications Python. Pour réaliser la tâche de manière simple, vous devez télécharger le fichier PDF sur le stockage cloud Aspose et effectuer la reconnaissance OCR sur le fichier PDF téléchargé. L'exemple suivant montre comment les développeurs de logiciels peuvent extraire le texte d'un fichier PDF à l'aide du code Python.

Comment extraire le texte d'un fichier PDF via l'API Python ?

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

Convertir le texte en parole via l'API Python

Le SDK Aspose.OCR Cloud pour Python permet aux développeurs de logiciels de convertir le texte d'une image sans installer de logiciel tiers. Grâce à l'API, les programmeurs peuvent convertir les résultats de la reconnaissance en une voix humaine naturelle qui peut être jouée en arrière-plan ou téléchargée. Le premier utilisateur doit envoyer l'image au serveur Aspose OCR Cloud et en extraire le texte, puis convertir le texte en parole à l'aide de l'API Aspose OCR Cloud Text-to-Speech. Une fois la conversion réussie, vous pouvez enregistrer le fichier vocal sur le disque.

Comment convertir du texte en parole à l'aide de l'API Python ?

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)

 Français