Aspose.OCR Cloud SDK for Python

La migliore API OCR Python per leggere ed estrarre testo di immagini

Aggiungi funzionalità OCR alle app Python tramite API OCR. Consente di leggere ed estrarre testo da immagini, foto, schermate, documenti scansionati e file PDF tramite la libreria OCR Python.

Aspose.OCR Cloud SDK per Python è una soluzione avanzata e flessibile di riconoscimento ottico dei caratteri (OCR) che aiuta gli sviluppatori di software a creare applicazioni OCR senza dipendenze esterne. Consente agli sviluppatori di software di leggere ed estrarre testo da immagini, foto, screenshot, documenti scansionati e PDF in un gran numero di script europei, cirillici e orientali, restituendo risultati nei formati di documenti più diffusi. L'API consente agli sviluppatori di aggiungere facilmente la funzionalità OCR a quasi tutti i dispositivi o piattaforme, inclusi netbook, mini PC o persino smartphone entry-level.

Aspose.OCR Cloud SDK per Python è semplice e facile da gestire. Fornisce un'ampia gamma di funzionalità che lo rendono una soluzione OCR ideale per gli sviluppatori che lavorano con Python, come leggere un'intera immagine, leggere un documento PDF scansionato, estrarre testo da una regione specifica dell'immagine, estrarre dati da un documento scansionato o fotografato ricevuta, recupero dei risultati del riconoscimento PDF, estrazione del testo da tabelle scansionate o fotografate, conversione dei risultati del riconoscimento in una voce umana naturale e molto altro.

Aspose.OCR Cloud SDK per Python è basato sull'API Aspose.OCR Cloud, è un motore OCR basato su cloud che supporta 45 lingue di riconoscimento tra cui inglese, francese, tedesco, spagnolo, cinese, giapponese, arabo e molti altri. Utilizzando l'SDK OCR, i programmatori Python possono integrare facilmente la funzionalità OCR nelle loro applicazioni Python senza doversi preoccupare delle complessità della tecnologia OCR. L'SDK fornisce un'interfaccia semplice e intuitiva che consente agli utenti di caricare immagini, eseguire l'OCR e recuperare testo in poche righe di codice. Se hai bisogno di aggiungere funzionalità OCR alle tue applicazioni Python, vale sicuramente la pena provare Aspose.OCR Cloud SDK per Python.

In sintesi

Una panoramica delle funzionalità Aspose.OCR Cloud SDK per Python.

Panoramica delle funzionalità

Esegui l'OCR
Aggiungi funzionalità OCR
Riconosci il testo dell'immagine
Converti immagini di testo
Testo carattere riconosciuto
Cerca PDF
27 lingue di riconoscimento
Crea app OCR
Salva nel browser
Estrai testo
Supporto multithreading

Panoramica delle funzionalità

Riconosci l'immagine ruotata
Filtri di pre-elaborazione
Da PDF a immagini
Riconosce i caratteri cinesi
Rileva i caratteri tipografici più diffusi
Elabora l'intera immagine
Supporto immagini ruotate
Riconoscimento batch
Controllo ortografico integrato
PDF diviso
Da PDF a Excel
Da PDF a SVG

Aspose.OCR Cloud SDK for Python

L'API supporta principalmente il formato PDF ma può esportare documenti PDF in numerosi altri formati.

Lettore

PDF, PDF/A, TEX, XPS, SVG

Scrittore

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR Cloud SDK for Python

Indipendenza dalla piattaforma

Aspose.OCR Cloud SDK per Python può funzionare con qualsiasi linguaggio di programmazione basato su Python.

Python 4.5 e versioni successive.

Aspose.OCR Cloud SDK for Python

Introduzione a Aspose.OCR Cloud SDK per Python

Il modo consigliato per installare Aspose.OCR Cloud SDK per Python utilizza pip. Si prega di utilizzare il seguente comando per un'installazione fluida.

Installa Aspose.OCR Cloud SDK per Python tramite pip

 pip install aspose-ocr-cloud

Puoi scaricare l'SDK direttamente dalla Aspose.OCR Python Cloud SDK pagina del prodotto

Riconoscimento delle immagini utilizzando app Python

Aspose.OCR Cloud SDK per Python consente agli sviluppatori di software di eseguire operazioni OCR per ottenere il riconoscimento delle immagini all'interno delle proprie applicazioni Python. L'API è molto semplice da usare e il riconoscimento delle immagini può essere eseguito da qualsiasi piattaforma con accesso a Internet. Puoi utilizzare facilmente l'API REST OCR per selezionare e inviare immagini per il riconoscimento, recuperare i risultati e archiviarli in qualsiasi formato di file supportato con solo un paio di righe di codice. L'esempio seguente mostra come eseguire l'operazione OCR sulle immagini utilizzando il codice Python.

Esegui l'OCR su un'immagine all'interno delle app Python

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

Estrai testo da file PDF tramite API Python

Il formato PDF (Portable Document Format) è uno dei formati di file per documenti aziendali più diffusi al mondo ed è un formato di file sviluppato da Adobe nel 1992 per presentare i documenti. Aspose.OCR Cloud SDK per Python ha incluso una funzionalità molto potente per estrarre testo da file PDF all'interno delle applicazioni Python. Per eseguire l'attività in modo semplice è necessario caricare il file PDF nell'archivio cloud Aspose ed eseguire il riconoscimento OCR sul file PDF caricato. L'esempio seguente mostra come gli sviluppatori di software possono estrarre testo da un file PDF utilizzando il codice Python.

Come estrarre testo da un file PDF tramite API Python?

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

Converti testo in voce tramite API Python

Aspose.OCR Cloud SDK per Python consente agli sviluppatori di software di convertire testo da immagini senza installare alcun software di terze parti. Utilizzando l'API, i programmatori possono convertire i risultati del riconoscimento in una voce umana naturale che può essere riprodotta in background o scaricata. Innanzitutto è necessario che l'utente invii l'immagine al server Aspose OCR Cloud ed estragga il testo da esso e successivamente converta il testo in voce utilizzando l'API Text-to-Speech di Aspose OCR Cloud. Dopo la conversione riuscita è possibile salvare il file vocale su disco.

Come convertire il testo in voce utilizzando l'API Python?

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)