Aspose.OCR Cloud SDK for Python

بهترین API Python OCR برای خواندن و استخراج متن تصاویر

قابلیت OCR را از طریق OCR API به برنامه های پایتون اضافه کنید. امکان خواندن و استخراج متن از تصاویر، عکس ها، اسکرین شات ها، اسناد اسکن شده و فایل های PDF از طریق کتابخانه OCR Python را فراهم می کند.

Aspose.OCR Cloud SDK برای Python یک راه حل تشخیص کاراکتر نوری (OCR) پیشرفته و انعطاف پذیر است که به توسعه دهندگان نرم افزار کمک می کند تا برنامه های OCR را بدون هیچ گونه وابستگی خارجی ایجاد کنند. این به توسعه دهندگان نرم افزار اجازه می دهد تا متن را از تصاویر، عکس ها، اسکرین شات ها، اسناد اسکن شده و PDF در تعداد زیادی از اسکریپت های اروپایی، سیریلیک و شرقی بخوانند و استخراج کنند و نتایج را در محبوب ترین فرمت های سند برگردانند. API افزودن عملکرد OCR را به تقریباً هر دستگاه یا پلتفرمی، از جمله نت‌بوک‌ها، رایانه‌های شخصی کوچک یا حتی تلفن‌های هوشمند سطح پایه برای توسعه‌دهندگان آسان می‌کند.

Aspose.OCR Cloud SDK برای پایتون ساده و آسان است. طیف گسترده ای از ویژگی ها را ارائه می دهد که آن را به یک راه حل ایده آل OCR برای توسعه دهندگانی که با پایتون کار می کنند، مانند خواندن یک تصویر کامل، خواندن یک سند PDF اسکن شده، استخراج متن از یک منطقه خاص از تصویر، استخراج داده ها از یک اسکن یا عکس گرفته شده ارائه می کند. رسید، واکشی نتایج تشخیص PDF، استخراج متن از جداول اسکن شده یا عکس گرفته شده، تبدیل نتایج تشخیص به صدای طبیعی انسان، و بسیاری موارد دیگر.

Aspose.OCR Cloud SDK برای Python بر روی Aspose.OCR Cloud API ساخته شده است، یک موتور OCR مبتنی بر ابر است که از 45 زبان تشخیص از جمله انگلیسی، فرانسوی، آلمانی، اسپانیایی، چینی، ژاپنی، عربی، و خیلی بیشتر. با استفاده از OCR SDK، برنامه نویسان پایتون می توانند به راحتی عملکرد OCR را در برنامه های پایتون خود ادغام کنند، بدون اینکه نگران پیچیدگی های فناوری OCR باشند. SDK یک رابط ساده و شهودی ارائه می دهد که به کاربران امکان می دهد تصاویر را آپلود کنند، OCR را انجام دهند و متن را تنها در چند خط کد بازیابی کنند. اگر می‌خواهید قابلیت OCR را به برنامه‌های پایتون خود اضافه کنید، Aspose.OCR Cloud SDK برای Python قطعا ارزش بررسی را دارد.

در یک نگاه

نمای کلی Aspose.OCR Cloud SDK برای ویژگی‌های Python.

بررسی اجمالی ویژگی ها

OCR را انجام دهید
افزودن قابلیت های OCR
تشخیص متن تصویر
تصاویر متن را کانوت کنید
متن قلم شناسایی شده
جستجوی PDF
27 زبان تشخیص
برنامه های OCR ایجاد کنید
ذخیره در مرورگر
متن را استخراج کنید
پشتیبانی از چند رشته

بررسی اجمالی ویژگی ها

تشخیص تصویر چرخیده
فیلترهای پیش پردازش
PDF به تصاویر
Chines Chars را می شناسد
تایپ‌های محبوب را تشخیص می‌دهد
تصویر کامل را پردازش می کند
پشتیبانی از تصاویر چرخش
تشخیص دسته
املای داخلی
تقسیم PDF
PDF به Excel
PDF به SVG

Aspose.OCR Cloud SDK for Python

API عمدتا از فرمت PDF پشتیبانی می کند اما می تواند اسناد PDF را به تعدادی فرمت دیگر صادر کند.

خواننده

PDF, PDF/A, TEX, XPS, SVG

نویسنده

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR Cloud SDK for Python

استقلال پلتفرم

Aspose.OCR Cloud SDK برای Python می تواند با هر زبان برنامه نویسی مبتنی بر پایتون کار کند.

Python 4.5 و بالاتر.

Aspose.OCR Cloud SDK for Python

شروع به کار با Aspose.OCR Cloud SDK برای Python

روش توصیه شده برای نصب Aspose.OCR Cloud SDK برای پایتون استفاده از پیپ است. لطفا از دستور زیر برای نصب راحت استفاده کنید.

 pip install aspose-ocr-cloud

می‌توانید SDK را مستقیماً از صفحه محصول Aspose.OCR Python Cloud SDK دانلود کنید

تشخیص تصویر با استفاده از برنامه های پایتون

Aspose.OCR Cloud SDK برای Python به توسعه دهندگان نرم افزار اجازه می دهد تا عملیات OCR را برای دستیابی به تشخیص تصویر در برنامه های پایتون خود انجام دهند. استفاده از API بسیار آسان است و تشخیص تصویر را می توان از هر پلتفرمی با دسترسی به اینترنت انجام داد. شما به راحتی می توانید از OCR REST API برای انتخاب و ارسال تصاویر برای شناسایی، واکشی نتایج و ذخیره آن در هر فرمت فایل پشتیبانی شده با تنها چند خط کد استفاده کنید. مثال زیر نحوه انجام عملیات OCR روی تصاویر را با استفاده از کد پایتون نشان می دهد.

OCR را روی یک تصویر در برنامه‌های پایتون انجام دهید

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

استخراج متن از فایل های PDF از طریق Python API

قالب سند قابل حمل (PDF) یکی از محبوب ترین فرمت های اسناد تجاری در جهان است و یک فرمت فایل است که توسط Adobe در سال 1992 برای ارائه اسناد توسعه یافته است. Aspose.OCR Cloud SDK برای پایتون یک ویژگی بسیار قدرتمند برای استخراج متن از فایل های PDF در داخل برنامه های پایتون در نظر گرفته است. برای رسیدن به این کار به روشی آسان، باید فایل PDF را در فضای ذخیره سازی ابری Aspose آپلود کنید و تشخیص OCR را روی فایل PDF آپلود شده انجام دهید. مثال زیر نشان می دهد که چگونه توسعه دهندگان نرم افزار می توانند متن را از یک فایل PDF با استفاده از کد پایتون استخراج کنند.

چگونه از طریق Python API متن را از فایل PDF استخراج کنیم؟

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

تبدیل متن به گفتار از طریق Python API

Aspose.OCR Cloud SDK برای Python به توسعه دهندگان نرم افزار امکان می دهد بدون نصب نرم افزار شخص ثالث، متن را از تصویر تبدیل کنند. با استفاده از API، برنامه نویسان می توانند نتایج تشخیص را به صدای طبیعی انسان تبدیل کنند که می تواند در پس زمینه پخش یا دانلود شود. کاربر ابتدا باید تصویر را به سرور Aspose OCR Cloud ارسال کند و متن را از آن استخراج کند و سپس متن را با استفاده از Aspose OCR Cloud Text-to-Speech API به گفتار تبدیل کند. پس از تبدیل موفقیت آمیز، می توانید فایل گفتار را در دیسک ذخیره کنید.

چگونه با استفاده از Python API متن را به گفتار تبدیل کنیم؟

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)