Aspose.OCR Cloud SDK for Python
بهترین API Python OCR برای خواندن و استخراج متن تصاویر
قابلیت OCR را از طریق OCR API به برنامه های پایتون اضافه کنید. امکان خواندن و استخراج متن از تصاویر، عکس ها، اسکرین شات ها، اسناد اسکن شده و فایل های PDF از طریق کتابخانه OCR Python را فراهم می کند.
Aspose.OCR Cloud SDK برای Python یک راه حل تشخیص کاراکتر نوری (OCR) پیشرفته و انعطاف پذیر است که به توسعه دهندگان نرم افزار کمک می کند تا برنامه های OCR را بدون هیچ گونه وابستگی خارجی ایجاد کنند. این به توسعه دهندگان نرم افزار اجازه می دهد تا متن را از تصاویر، عکس ها، اسکرین شات ها، اسناد اسکن شده و PDF در تعداد زیادی از اسکریپت های اروپایی، سیریلیک و شرقی بخوانند و استخراج کنند و نتایج را در محبوب ترین فرمت های سند برگردانند. API افزودن عملکرد OCR را به تقریباً هر دستگاه یا پلتفرمی، از جمله نتبوکها، رایانههای شخصی کوچک یا حتی تلفنهای هوشمند سطح پایه برای توسعهدهندگان آسان میکند.
Aspose.OCR Cloud SDK برای پایتون ساده و آسان است. طیف گسترده ای از ویژگی ها را ارائه می دهد که آن را به یک راه حل ایده آل OCR برای توسعه دهندگانی که با پایتون کار می کنند، مانند خواندن یک تصویر کامل، خواندن یک سند PDF اسکن شده، استخراج متن از یک منطقه خاص از تصویر، استخراج داده ها از یک اسکن یا عکس گرفته شده ارائه می کند. رسید، واکشی نتایج تشخیص PDF، استخراج متن از جداول اسکن شده یا عکس گرفته شده، تبدیل نتایج تشخیص به صدای طبیعی انسان، و بسیاری موارد دیگر.
Aspose.OCR Cloud SDK برای Python بر روی Aspose.OCR Cloud API ساخته شده است، یک موتور OCR مبتنی بر ابر است که از 45 زبان تشخیص از جمله انگلیسی، فرانسوی، آلمانی، اسپانیایی، چینی، ژاپنی، عربی، و خیلی بیشتر. با استفاده از OCR SDK، برنامه نویسان پایتون می توانند به راحتی عملکرد OCR را در برنامه های پایتون خود ادغام کنند، بدون اینکه نگران پیچیدگی های فناوری OCR باشند. SDK یک رابط ساده و شهودی ارائه می دهد که به کاربران امکان می دهد تصاویر را آپلود کنند، OCR را انجام دهند و متن را تنها در چند خط کد بازیابی کنند. اگر میخواهید قابلیت OCR را به برنامههای پایتون خود اضافه کنید، Aspose.OCR Cloud SDK برای Python قطعا ارزش بررسی را دارد.
شروع به کار با Aspose.OCR Cloud SDK برای Python
روش توصیه شده برای نصب Aspose.OCR Cloud SDK برای پایتون استفاده از پیپ است. لطفا از دستور زیر برای نصب راحت استفاده کنید.
pip install aspose-ocr-cloud
میتوانید SDK را مستقیماً از صفحه محصول Aspose.OCR Python Cloud SDK دانلود کنید
تشخیص تصویر با استفاده از برنامه های پایتون
Aspose.OCR Cloud SDK برای Python به توسعه دهندگان نرم افزار اجازه می دهد تا عملیات OCR را برای دستیابی به تشخیص تصویر در برنامه های پایتون خود انجام دهند. استفاده از API بسیار آسان است و تشخیص تصویر را می توان از هر پلتفرمی با دسترسی به اینترنت انجام داد. شما به راحتی می توانید از OCR REST API برای انتخاب و ارسال تصاویر برای شناسایی، واکشی نتایج و ذخیره آن در هر فرمت فایل پشتیبانی شده با تنها چند خط کد استفاده کنید. مثال زیر نحوه انجام عملیات OCR روی تصاویر را با استفاده از کد پایتون نشان می دهد.
OCR را روی یک تصویر در برنامههای پایتون انجام دهید
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
استخراج متن از فایل های PDF از طریق Python API
قالب سند قابل حمل (PDF) یکی از محبوب ترین فرمت های اسناد تجاری در جهان است و یک فرمت فایل است که توسط Adobe در سال 1992 برای ارائه اسناد توسعه یافته است. Aspose.OCR Cloud SDK برای پایتون یک ویژگی بسیار قدرتمند برای استخراج متن از فایل های PDF در داخل برنامه های پایتون در نظر گرفته است. برای رسیدن به این کار به روشی آسان، باید فایل PDF را در فضای ذخیره سازی ابری Aspose آپلود کنید و تشخیص OCR را روی فایل PDF آپلود شده انجام دهید. مثال زیر نشان می دهد که چگونه توسعه دهندگان نرم افزار می توانند متن را از یک فایل PDF با استفاده از کد پایتون استخراج کنند.
چگونه از طریق Python API متن را از فایل PDF استخراج کنیم؟
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
تبدیل متن به گفتار از طریق Python API
Aspose.OCR Cloud SDK برای Python به توسعه دهندگان نرم افزار امکان می دهد بدون نصب نرم افزار شخص ثالث، متن را از تصویر تبدیل کنند. با استفاده از API، برنامه نویسان می توانند نتایج تشخیص را به صدای طبیعی انسان تبدیل کنند که می تواند در پس زمینه پخش یا دانلود شود. کاربر ابتدا باید تصویر را به سرور Aspose OCR Cloud ارسال کند و متن را از آن استخراج کند و سپس متن را با استفاده از Aspose OCR Cloud Text-to-Speech API به گفتار تبدیل کند. پس از تبدیل موفقیت آمیز، می توانید فایل گفتار را در دیسک ذخیره کنید.
چگونه با استفاده از Python API متن را به گفتار تبدیل کنیم؟
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)