1. Продукти
  2.   OCR
  3.   Python
  4.   Aspose.OCR Cloud SDK for Python

Aspose.OCR Cloud SDK for Python

 
 

Най-добрият API на Python OCR за четене и извличане на текст от изображения

Добавете функционалност за OCR към приложения на Python чрез OCR API. Позволява четене и извличане на текст от изображения, снимки, екранни снимки, сканирани документи и PDF файлове чрез Python OCR библиотека.

Aspose.OCR Cloud SDK за Python е усъвършенствано и гъвкаво решение за оптично разпознаване на знаци (OCR), което помага на разработчиците на софтуер да създават OCR приложения без никакви външни зависимости. Той позволява на разработчиците на софтуер да четат и извличат текст от изображения, снимки, екранни снимки, сканирани документи и PDF файлове в голям брой европейски, кирилски и източни шрифтове, връщайки резултати в най-популярните формати на документи. API улеснява разработчиците да добавят OCR функционалност към почти всяко устройство или платформа, включително нетбуци, мини компютри или дори смартфони от начално ниво.

Aspose.OCR Cloud SDK за Python е ясен и лесен за работа. Той предоставя широк набор от функции, които го правят идеално OCR решение за разработчици, работещи с Python, като четене на цяло изображение, четене на сканиран PDF документ, извличане на текст от определена област на изображението, извличане на данни от сканиран или фотографиран разписка, извличане на резултати от разпознаване на PDF, извличане на текст от сканирани или фотографирани таблици, преобразуване на резултатите от разпознаване в естествен човешки глас и много други.

Aspose.OCR Cloud SDK за Python е изграден върху Aspose.OCR Cloud API, е базиран на облак OCR двигател, който поддържа 45 езика за разпознаване, включително английски, френски, немски, испански, китайски, японски, арабски и много повече. Използвайки OCR SDK, Python програмистите могат лесно да интегрират OCR функционалност в своите Python приложения, без да се притесняват за сложността на OCR технологията. SDK предоставя прост и интуитивен интерфейс, който позволява на потребителите да качват изображения, да извършват OCR и да извличат текст само с няколко реда код. Ако трябва да добавите OCR функционалност към вашите приложения на Python, Aspose.OCR Cloud SDK за Python определено си струва да се провери.

Previous Next

Първи стъпки с Aspose.OCR Cloud SDK за Python

Препоръчителният начин за инсталиране на Aspose.OCR Cloud SDK за Python е използването на pip. Моля, използвайте следната команда за гладка инсталация.

Инсталирайте Aspose.OCR Cloud SDK за Python чрез pip

 pip install aspose-ocr-cloud

Можете да изтеглите SDK директно от страницата на продукта Aspose.OCR Python Cloud SDK

Разпознаване на изображения с помощта на приложения на Python

Aspose.OCR Cloud SDK за Python позволява на разработчиците на софтуер да извършват OCR операция, за да постигнат разпознаване на изображения в собствените си приложения на Python. API е много лесен за използване и разпознаването на изображения може да се извърши от всяка платформа с достъп до Интернет. Можете лесно да използвате OCR REST API, за да избирате и изпращате изображения за разпознаване, да извличате резултати и да ги съхранявате във всички поддържани файлови формати само с няколко реда код. Следващият пример показва как да извършите OCR операция върху изображения с помощта на код на Python.

Извършване на OCR върху изображение в Python Apps

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

Извличане на текст от PDF файлове чрез API на Python

Portable Document Format (PDF) е един от най-популярните файлови формати за бизнес документи в света и е файлов формат, разработен от Adobe през 1992 г. за представяне на документи. Aspose.OCR Cloud SDK за Python включва много мощна функция за извличане на текст от PDF файлове в приложения на Python. За да постигнете задачата по лесен начин, трябва да качите PDF файла в облачното хранилище на Aspose и да извършите OCR разпознаване на качения PDF файл. Следващият пример показва как разработчиците на софтуер могат да извлекат текст от PDF файл с помощта на код на Python.

Как да извлечете текст от PDF файл чрез API на Python?

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

Преобразуване на текст в говор чрез API на Python

Aspose.OCR Cloud SDK за Python позволява на разработчиците на софтуер да конвертират текст от изображение, без да инсталират софтуер на трета страна. Използвайки API, програмистите могат да конвертират резултатите от разпознаването в естествен човешки глас, който може да се възпроизвежда във фонов режим или да се изтегли. Първият потребител трябва да изпрати изображението до сървъра на Aspose OCR Cloud и да извлече текст от него и след това да преобразува текста в реч с помощта на API на Aspose OCR Cloud Text-to-Speech. След успешното преобразуване можете да запишете говорния файл на диск.

Как да конвертирате текст в говор с помощта на API на Python?

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)

 Български