Aspose.OCR Cloud SDK for Python

أفضل واجهة برمجة تطبيقات Python OCR لقراءة واستخراج نص الصور

أضف وظيفة التعرف الضوئي على الحروف (OCR) إلى تطبيقات Python عبر OCR API. يسمح بقراءة واستخراج النص من الصور والصور ولقطات الشاشة والمستندات الممسوحة ضوئيًا وملفات PDF عبر مكتبة Python OCR.

Aspose.OCR Cloud SDK for Python هو حل متقدم ومرن للتعرف البصري على الأحرف (OCR) يساعد مطوري البرامج على إنشاء تطبيقات التعرف الضوئي على الحروف دون أي تبعيات خارجية. فهو يسمح لمطوري البرامج بقراءة واستخراج النص من الصور والصور الفوتوغرافية ولقطات الشاشة والمستندات الممسوحة ضوئيًا وملفات PDF بعدد كبير من النصوص الأوروبية والسيريلية والشرقية، مما يؤدي إلى إرجاع النتائج بتنسيقات المستندات الأكثر شيوعًا. تسهل واجهة برمجة التطبيقات (API) على المطورين إضافة وظيفة التعرف الضوئي على الحروف (OCR) إلى أي جهاز أو نظام أساسي تقريبًا، بما في ذلك أجهزة الكمبيوتر المحمولة أو أجهزة الكمبيوتر الصغيرة أو حتى الهواتف الذكية ذات المستوى المبدئي.

تتميز Aspose.OCR Cloud SDK لـ Python بالبساطة وسهولة التعامل معها. فهو يوفر مجموعة واسعة من الميزات التي تجعله حلاً مثاليًا للتعرف الضوئي على الحروف (OCR) للمطورين الذين يعملون مع Python، مثل قراءة صورة كاملة، وقراءة مستند PDF ممسوح ضوئيًا، واستخراج النص من منطقة معينة من الصورة، واستخراج البيانات من صورة ممسوحة ضوئيًا أو مصورة الاستلام، وجلب نتائج التعرف على ملفات PDF، واستخراج النص من الجداول الممسوحة ضوئيًا أو المصورة، وتحويل نتائج التعرف إلى صوت بشري طبيعي، وغير ذلك الكثير.

تم إنشاء Aspose.OCR Cloud SDK for Python على واجهة Aspose.OCR Cloud API، وهو محرك OCR قائم على السحابة ويدعم 45 لغة التعرف بما في ذلك الإنجليزية والفرنسية والألمانية والإسبانية والصينية واليابانية والعربية و اكثر كثير. باستخدام OCR SDK، يمكن لمبرمجي Python دمج وظائف OCR بسهولة في تطبيقات Python الخاصة بهم دون الحاجة إلى القلق بشأن تعقيدات تقنية OCR. يوفر SDK واجهة بسيطة وبديهية تتيح للمستخدمين تحميل الصور وإجراء التعرف الضوئي على الحروف واسترداد النص في بضعة أسطر فقط من التعليمات البرمجية. إذا كنت بحاجة إلى إضافة وظيفة التعرف الضوئي على الحروف (OCR) إلى تطبيقات Python الخاصة بك، فمن المؤكد أن Aspose.OCR Cloud SDK for Python يستحق التدقيق.

نظرة سريعة

نظرة عامة على ميزات Aspose.OCR Cloud SDK لـ Python.

نظرة عامة على الميزات

إجراء التعرف الضوئي على الحروف
أضف قدرات التعرف الضوئي على الحروف
التعرف على نص الصورة
تحويل صور النص
نص الخط الذي تم التعرف عليه
ابحث في ملف PDF
27 لغة التعرف
إنشاء تطبيقات التعرف الضوئي على الحروف
حفظ في المتصفح
استخرج النص
دعم تعدد الخيوط

نظرة عامة على الميزات

التعرف على الصورة التي تم تدويرها
مرشحات المعالجة المسبقة
تحويل PDF إلى صور
يتعرف على الأحرف الصينية
يكتشف الخطوط الشائعة
يعالج الصورة بأكملها
دعم الصور المدورة
التعرف على الدفعة
المدقق الإملائي المدمج
تقسيم ملف PDF
تحويل PDF إلى Excel
من PDF إلى SVG

Aspose.OCR Cloud SDK for Python

تدعم واجهة برمجة التطبيقات بشكل أساسي تنسيق PDF ولكن يمكنها تصدير مستندات PDF إلى عدد من التنسيقات الأخرى.

قارئ

PDF, PDF/A, TEX, XPS, SVG

كاتب

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR Cloud SDK for Python

استقلالية النظام الأساسي

يمكن أن يعمل Aspose.OCR Cloud SDK for Python مع أي لغة برمجة تعتمد على Python.

بايثون 4.5 وما فوق.

Aspose.OCR Cloud SDK for Python

البدء باستخدام Aspose.OCR Cloud SDK لـ Python

الطريقة الموصى بها لتثبيت Aspose.OCR Cloud SDK لـ Python هي استخدام النقطة. الرجاء استخدام الأمر التالي للتثبيت السلس.

قم بتثبيت Aspose.OCR Cloud SDK لـ Python عبر النقطة

 pip install aspose-ocr-cloud

يمكنك تنزيل SDK مباشرة من Aspose.OCR Python Cloud SDK صفحة المنتج

التعرف على الصور باستخدام تطبيقات Python

يسمح Aspose.OCR Cloud SDK for Python لمطوري البرامج بإجراء عملية التعرف الضوئي على الحروف لتحقيق التعرف على الصور داخل تطبيقات Python الخاصة بهم. واجهة برمجة التطبيقات (API) سهلة الاستخدام للغاية ويمكن إجراء التعرف على الصور من أي نظام أساسي متصل بالإنترنت. يمكنك بسهولة استخدام OCR REST API لتحديد الصور وإرسالها للتعرف عليها وجلب النتائج وتخزينها بأي تنسيقات ملفات مدعومة باستخدام سطرين فقط من التعليمات البرمجية. يوضح المثال التالي كيفية إجراء عملية التعرف الضوئي على الحروف (OCR) على الصور باستخدام كود Python.

إجراء التعرف الضوئي على الحروف على صورة داخل تطبيقات Python

import asposeocrcloud

# create an instance of the OCR client
client = asposeocrcloud.OcrApi(api_key='your_api_key', app_sid='your_app_sid')

# read the image file
with open('image.jpg', 'rb') as image_file:
    image_data = image_file.read()

# call the OCR API to extract text from the image
result = client.post_ocr(image_data=image_data, language='eng', use_default_dictionaries=True)

# print the extracted text
print(result.text)

استخرج النص من ملفات PDF عبر Python API

يعد تنسيق المستندات المحمولة (PDF) أحد تنسيقات ملفات مستندات الأعمال الأكثر شيوعًا في العالم وهو تنسيق ملف تم تطويره بواسطة Adobe في عام 1992 لتقديم المستندات. يتضمن Aspose.OCR Cloud SDK for Python ميزة قوية جدًا لاستخراج النص من ملفات PDF داخل تطبيقات Python. لتحقيق المهمة بطريقة سهلة، تحتاج إلى تحميل ملف PDF إلى وحدة التخزين السحابية Aspose وإجراء التعرف الضوئي على الحروف (OCR) على ملف PDF الذي تم تحميله. يوضح المثال التالي كيف يمكن لمطوري البرامج استخراج النص من ملف PDF باستخدام كود Python.

كيفية استخراج النص من ملف PDF عبر Python API؟

import asposeocrcloud
from asposeocrcloud.apis.ocr_api import OcrApi
from asposeocrcloud.configuration import Configuration

configuration = Configuration(api_key='your_api_key', app_sid='your_app_sid')
api = OcrApi(asposeocrcloud.ApiClient(configuration))

# Upload the PDF file to the Aspose cloud storage

with open('your_pdf_file.pdf', 'rb') as file:
    api.upload_file(path='your_pdf_file.pdf', file=file)

# Perform the OCR recognition on the uploaded PDF file
result = api.post_recognize_ocr_from_url_or_content(file_path='your_pdf_file.pdf')

# Story the recognized text

recognized_text = result['text']
print(recognized_text)

تحويل النص إلى كلام عبر Python API

يُمكّن Aspose.OCR Cloud SDK for Python مطوري البرامج من تحويل النص من الصورة دون تثبيت أي برنامج تابع لجهة خارجية. باستخدام واجهة برمجة التطبيقات (API)، يمكن للمبرمجين تحويل نتائج التعرف إلى صوت بشري طبيعي يمكن تشغيله في الخلفية أو تنزيله. يحتاج المستخدم الأول إلى إرسال الصورة إلى خادم Aspose OCR Cloud واستخراج النص منها وبعد ذلك تحويل النص إلى كلام باستخدام Aspose OCR Cloud Text-to-Speech API. بعد التحويل الناجح يمكنك حفظ ملف الكلام على القرص.

كيفية تحويل النص إلى كلام باستخدام Python API؟

 import os
from asposeocrcloud import OcrApi, OcrClient, SpeechApi

client_id = os.environ['CLIENT_ID']
client_secret = os.environ['CLIENT_SECRET']
ocr_api = OcrApi(OcrClient(client_id, client_secret))
speech_api = SpeechApi(OcrClient(client_id, client_secret))

# Upload the image containing the text
filename = 'image.png'
with open(filename, 'rb') as file:
    response = ocr_api.post_recognize_from_content(file.read(), language='English', use_default_dictionaries=True)

# Extract the recognized text

text = ''
for result in response.parts:
    for line in result.lines:
        for word in line.words:
            text += word.text + ' '

# Convert the text to speech
response = speech_api.post_recognize_from_text(text, language='en-US', voice_name='Ben')

# Save the speech file to disk

with open('output.wav', 'wb') as file:
    file.write(response.content)