Aspose.OCR Cloud SDK for Python
Melhor API Python OCR para ler e extrair texto de imagens
Adicione funcionalidade OCR a aplicativos Python por meio da API OCR. Permite ler e extrair texto de imagens, fotos, capturas de tela, documentos digitalizados e arquivos PDF por meio da biblioteca Python OCR.
Aspose.OCR Cloud SDK para Python é uma solução avançada e flexível de reconhecimento óptico de caracteres (OCR) que ajuda os desenvolvedores de software a criar aplicativos de OCR sem quaisquer dependências externas. Ele permite que os desenvolvedores de software leiam e extraiam texto de imagens, fotos, capturas de tela, documentos digitalizados e PDFs em um grande número de escritas europeias, cirílicas e orientais, retornando resultados nos formatos de documentos mais populares. A API torna mais fácil para os desenvolvedores adicionarem funcionalidade de OCR a praticamente qualquer dispositivo ou plataforma, incluindo netbooks, mini PCs ou até mesmo smartphones básicos.
O Aspose.OCR Cloud SDK para Python é direto e fácil de usar. Ele fornece uma ampla gama de recursos que o tornam uma solução de OCR ideal para desenvolvedores que trabalham com Python, como ler uma imagem inteira, ler um documento PDF digitalizado, extrair texto de uma região específica da imagem, extrair dados de um documento digitalizado ou fotografado. recebimento, obtenção de resultados de reconhecimento de PDF, extração de texto de tabelas digitalizadas ou fotografadas, conversão dos resultados de reconhecimento em uma voz humana natural e muito mais.
Aspose.OCR Cloud SDK para Python é construído sobre a API Aspose.OCR Cloud, é um mecanismo de OCR baseado em nuvem que suporta 45 idiomas de reconhecimento, incluindo inglês, francês, alemão, espanhol, chinês, japonês, árabe e muito mais. Usando o OCR SDK, os programadores Python podem integrar facilmente a funcionalidade OCR em seus aplicativos Python sem precisar se preocupar com as complexidades da tecnologia OCR. O SDK fornece uma interface simples e intuitiva que permite aos usuários fazer upload de imagens, realizar OCR e recuperar texto em apenas algumas linhas de código. Se você precisar adicionar funcionalidade de OCR aos seus aplicativos Python, definitivamente vale a pena conferir o Aspose.OCR Cloud SDK para Python.
Primeiros passos com Aspose.OCR Cloud SDK para Python
A maneira recomendada de instalar o Aspose.OCR Cloud SDK para Python é usando pip. Use o seguinte comando para uma instalação tranquila.
Instale o Aspose.OCR Cloud SDK para Python via pip
pip install aspose-ocr-cloud
Você pode baixar o SDK diretamente da página do produto Aspose.OCR Python Cloud SDK
Reconhecimento de imagem usando aplicativos Python
Aspose.OCR Cloud SDK para Python permite que desenvolvedores de software executem operações de OCR para obter reconhecimento de imagem dentro de seus próprios aplicativos Python. A API é muito fácil de usar e o reconhecimento de imagens pode ser realizado a partir de qualquer plataforma com acesso à Internet. Você pode usar facilmente a API REST de OCR para selecionar e enviar imagens para reconhecimento, buscar resultados e armazená-los em qualquer formato de arquivo compatível com apenas algumas linhas de código. O exemplo a seguir mostra como executar a operação de OCR em imagens usando código Python.
Execute OCR em uma imagem dentro de aplicativos Python
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
Extrair texto de arquivos PDF via API Python
Portable Document Format (PDF) é um dos formatos de arquivo de documentos comerciais mais populares do mundo e é um formato de arquivo desenvolvido pela Adobe em 1992 para apresentar documentos. Aspose.OCR Cloud SDK para Python incluiu um recurso muito poderoso para extrair texto de arquivos PDF dentro de aplicativos Python. Para realizar a tarefa de maneira fácil, você precisa fazer upload do arquivo PDF para o armazenamento em nuvem Aspose e realizar o reconhecimento OCR no arquivo PDF carregado. O exemplo a seguir mostra como os desenvolvedores de software podem extrair texto de um arquivo PDF usando código Python.
Como extrair texto de um arquivo PDF via API Python?
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
Converter texto em fala por meio da API Python
Aspose.OCR Cloud SDK para Python permite que desenvolvedores de software convertam texto de imagem sem instalar nenhum software de terceiros. Usando a API, os programadores podem converter os resultados do reconhecimento em uma voz humana natural que pode ser reproduzida em segundo plano ou baixada. O primeiro usuário precisa enviar a imagem para o servidor Aspose OCR Cloud e extrair o texto dele e depois converter o texto em fala usando a API Aspose OCR Cloud Text-to-Speech. Após a conversão bem-sucedida, você pode salvar o arquivo de fala no disco.
Como converter texto em fala usando a API Python?
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)