Aspose.OCR Cloud SDK for Python
La migliore API OCR Python per leggere ed estrarre testo di immagini
Aggiungi funzionalità OCR alle app Python tramite API OCR. Consente di leggere ed estrarre testo da immagini, foto, schermate, documenti scansionati e file PDF tramite la libreria OCR Python.
Aspose.OCR Cloud SDK per Python è una soluzione avanzata e flessibile di riconoscimento ottico dei caratteri (OCR) che aiuta gli sviluppatori di software a creare applicazioni OCR senza dipendenze esterne. Consente agli sviluppatori di software di leggere ed estrarre testo da immagini, foto, screenshot, documenti scansionati e PDF in un gran numero di script europei, cirillici e orientali, restituendo risultati nei formati di documenti più diffusi. L'API consente agli sviluppatori di aggiungere facilmente la funzionalità OCR a quasi tutti i dispositivi o piattaforme, inclusi netbook, mini PC o persino smartphone entry-level.
Aspose.OCR Cloud SDK per Python è semplice e facile da gestire. Fornisce un'ampia gamma di funzionalità che lo rendono una soluzione OCR ideale per gli sviluppatori che lavorano con Python, come leggere un'intera immagine, leggere un documento PDF scansionato, estrarre testo da una regione specifica dell'immagine, estrarre dati da un documento scansionato o fotografato ricevuta, recupero dei risultati del riconoscimento PDF, estrazione del testo da tabelle scansionate o fotografate, conversione dei risultati del riconoscimento in una voce umana naturale e molto altro.
Aspose.OCR Cloud SDK per Python è basato sull'API Aspose.OCR Cloud, è un motore OCR basato su cloud che supporta 45 lingue di riconoscimento tra cui inglese, francese, tedesco, spagnolo, cinese, giapponese, arabo e molti altri. Utilizzando l'SDK OCR, i programmatori Python possono integrare facilmente la funzionalità OCR nelle loro applicazioni Python senza doversi preoccupare delle complessità della tecnologia OCR. L'SDK fornisce un'interfaccia semplice e intuitiva che consente agli utenti di caricare immagini, eseguire l'OCR e recuperare testo in poche righe di codice. Se hai bisogno di aggiungere funzionalità OCR alle tue applicazioni Python, vale sicuramente la pena provare Aspose.OCR Cloud SDK per Python.
Introduzione a Aspose.OCR Cloud SDK per Python
Il modo consigliato per installare Aspose.OCR Cloud SDK per Python utilizza pip. Si prega di utilizzare il seguente comando per un'installazione fluida.
Installa Aspose.OCR Cloud SDK per Python tramite pip
pip install aspose-ocr-cloud
Puoi scaricare l'SDK direttamente dalla Aspose.OCR Python Cloud SDK pagina del prodotto
Riconoscimento delle immagini utilizzando app Python
Aspose.OCR Cloud SDK per Python consente agli sviluppatori di software di eseguire operazioni OCR per ottenere il riconoscimento delle immagini all'interno delle proprie applicazioni Python. L'API è molto semplice da usare e il riconoscimento delle immagini può essere eseguito da qualsiasi piattaforma con accesso a Internet. Puoi utilizzare facilmente l'API REST OCR per selezionare e inviare immagini per il riconoscimento, recuperare i risultati e archiviarli in qualsiasi formato di file supportato con solo un paio di righe di codice. L'esempio seguente mostra come eseguire l'operazione OCR sulle immagini utilizzando il codice Python.
Esegui l'OCR su un'immagine all'interno delle app Python
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
Estrai testo da file PDF tramite API Python
Il formato PDF (Portable Document Format) è uno dei formati di file per documenti aziendali più diffusi al mondo ed è un formato di file sviluppato da Adobe nel 1992 per presentare i documenti. Aspose.OCR Cloud SDK per Python ha incluso una funzionalità molto potente per estrarre testo da file PDF all'interno delle applicazioni Python. Per eseguire l'attività in modo semplice è necessario caricare il file PDF nell'archivio cloud Aspose ed eseguire il riconoscimento OCR sul file PDF caricato. L'esempio seguente mostra come gli sviluppatori di software possono estrarre testo da un file PDF utilizzando il codice Python.
Come estrarre testo da un file PDF tramite API Python?
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
Converti testo in voce tramite API Python
Aspose.OCR Cloud SDK per Python consente agli sviluppatori di software di convertire testo da immagini senza installare alcun software di terze parti. Utilizzando l'API, i programmatori possono convertire i risultati del riconoscimento in una voce umana naturale che può essere riprodotta in background o scaricata. Innanzitutto è necessario che l'utente invii l'immagine al server Aspose OCR Cloud ed estragga il testo da esso e successivamente converta il testo in voce utilizzando l'API Text-to-Speech di Aspose OCR Cloud. Dopo la conversione riuscita è possibile salvare il file vocale su disco.
Come convertire il testo in voce utilizzando l'API Python?
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)