Aspose.OCR Cloud SDK for Python
أفضل واجهة برمجة تطبيقات Python OCR لقراءة واستخراج نص الصور
أضف وظيفة التعرف الضوئي على الحروف (OCR) إلى تطبيقات Python عبر OCR API. يسمح بقراءة واستخراج النص من الصور والصور ولقطات الشاشة والمستندات الممسوحة ضوئيًا وملفات PDF عبر مكتبة Python OCR.
Aspose.OCR Cloud SDK for Python هو حل متقدم ومرن للتعرف البصري على الأحرف (OCR) يساعد مطوري البرامج على إنشاء تطبيقات التعرف الضوئي على الحروف دون أي تبعيات خارجية. فهو يسمح لمطوري البرامج بقراءة واستخراج النص من الصور والصور الفوتوغرافية ولقطات الشاشة والمستندات الممسوحة ضوئيًا وملفات PDF بعدد كبير من النصوص الأوروبية والسيريلية والشرقية، مما يؤدي إلى إرجاع النتائج بتنسيقات المستندات الأكثر شيوعًا. تسهل واجهة برمجة التطبيقات (API) على المطورين إضافة وظيفة التعرف الضوئي على الحروف (OCR) إلى أي جهاز أو نظام أساسي تقريبًا، بما في ذلك أجهزة الكمبيوتر المحمولة أو أجهزة الكمبيوتر الصغيرة أو حتى الهواتف الذكية ذات المستوى المبدئي.
تتميز Aspose.OCR Cloud SDK لـ Python بالبساطة وسهولة التعامل معها. فهو يوفر مجموعة واسعة من الميزات التي تجعله حلاً مثاليًا للتعرف الضوئي على الحروف (OCR) للمطورين الذين يعملون مع Python، مثل قراءة صورة كاملة، وقراءة مستند PDF ممسوح ضوئيًا، واستخراج النص من منطقة معينة من الصورة، واستخراج البيانات من صورة ممسوحة ضوئيًا أو مصورة الاستلام، وجلب نتائج التعرف على ملفات PDF، واستخراج النص من الجداول الممسوحة ضوئيًا أو المصورة، وتحويل نتائج التعرف إلى صوت بشري طبيعي، وغير ذلك الكثير.
تم إنشاء Aspose.OCR Cloud SDK for Python على واجهة Aspose.OCR Cloud API، وهو محرك OCR قائم على السحابة ويدعم 45 لغة التعرف بما في ذلك الإنجليزية والفرنسية والألمانية والإسبانية والصينية واليابانية والعربية و اكثر كثير. باستخدام OCR SDK، يمكن لمبرمجي Python دمج وظائف OCR بسهولة في تطبيقات Python الخاصة بهم دون الحاجة إلى القلق بشأن تعقيدات تقنية OCR. يوفر SDK واجهة بسيطة وبديهية تتيح للمستخدمين تحميل الصور وإجراء التعرف الضوئي على الحروف واسترداد النص في بضعة أسطر فقط من التعليمات البرمجية. إذا كنت بحاجة إلى إضافة وظيفة التعرف الضوئي على الحروف (OCR) إلى تطبيقات Python الخاصة بك، فمن المؤكد أن Aspose.OCR Cloud SDK for Python يستحق التدقيق.
البدء باستخدام Aspose.OCR Cloud SDK لـ Python
الطريقة الموصى بها لتثبيت Aspose.OCR Cloud SDK لـ Python هي استخدام النقطة. الرجاء استخدام الأمر التالي للتثبيت السلس.
قم بتثبيت Aspose.OCR Cloud SDK لـ Python عبر النقطة
pip install aspose-ocr-cloud
يمكنك تنزيل SDK مباشرة من Aspose.OCR Python Cloud SDK صفحة المنتج
التعرف على الصور باستخدام تطبيقات Python
يسمح Aspose.OCR Cloud SDK for Python لمطوري البرامج بإجراء عملية التعرف الضوئي على الحروف لتحقيق التعرف على الصور داخل تطبيقات Python الخاصة بهم. واجهة برمجة التطبيقات (API) سهلة الاستخدام للغاية ويمكن إجراء التعرف على الصور من أي نظام أساسي متصل بالإنترنت. يمكنك بسهولة استخدام OCR REST API لتحديد الصور وإرسالها للتعرف عليها وجلب النتائج وتخزينها بأي تنسيقات ملفات مدعومة باستخدام سطرين فقط من التعليمات البرمجية. يوضح المثال التالي كيفية إجراء عملية التعرف الضوئي على الحروف (OCR) على الصور باستخدام كود Python.
إجراء التعرف الضوئي على الحروف على صورة داخل تطبيقات Python
import asposeocrcloud
# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')
# read the image file
with open('image.jpg', 'rb') as image_file:
image_data = image_file.read()
# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)
# print the extracted text
print(result.text)
استخرج النص من ملفات PDF عبر Python API
يعد تنسيق المستندات المحمولة (PDF) أحد تنسيقات ملفات مستندات الأعمال الأكثر شيوعًا في العالم وهو تنسيق ملف تم تطويره بواسطة Adobe في عام 1992 لتقديم المستندات. يتضمن Aspose.OCR Cloud SDK for Python ميزة قوية جدًا لاستخراج النص من ملفات PDF داخل تطبيقات Python. لتحقيق المهمة بطريقة سهلة، تحتاج إلى تحميل ملف PDF إلى وحدة التخزين السحابية Aspose وإجراء التعرف الضوئي على الحروف (OCR) على ملف PDF الذي تم تحميله. يوضح المثال التالي كيف يمكن لمطوري البرامج استخراج النص من ملف PDF باستخدام كود Python.
كيفية استخراج النص من ملف PDF عبر Python API؟
import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration
configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))
# Upload the PDF file to the Aspose cloud storage
with open('your_pdf_file.pdf', 'rb') as file:
api.upload_file(path='your_pdf_file.pdf', file=file)
# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')
# Story the recognized text
recognized_text = result['text']
print(recognized_text)
تحويل النص إلى كلام عبر Python API
يُمكّن Aspose.OCR Cloud SDK for Python مطوري البرامج من تحويل النص من الصورة دون تثبيت أي برنامج تابع لجهة خارجية. باستخدام واجهة برمجة التطبيقات (API)، يمكن للمبرمجين تحويل نتائج التعرف إلى صوت بشري طبيعي يمكن تشغيله في الخلفية أو تنزيله. يحتاج المستخدم الأول إلى إرسال الصورة إلى خادم Aspose OCR Cloud واستخراج النص منها وبعد ذلك تحويل النص إلى كلام باستخدام Aspose OCR Cloud Text-to-Speech API. بعد التحويل الناجح يمكنك حفظ ملف الكلام على القرص.
كيفية تحويل النص إلى كلام باستخدام Python API؟
import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi
client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))
# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)
# Extract the recognized text
text = ''
for result in response.parts:
for line in result.lines:
for word in line.words:
text += word.text + ' '
# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')
# Save the speech file to disk
with open('output.wav', 'wb') as file:
file.write(response.content)