1. منتجات
  2.   OCR
  3.   Python
  4.   PaddleOCR
 
  

واجهة برمجة تطبيقات Python مفتوحة المصدر لدمج قدرات التعرف الضوئي على الحروف

مكتبة Python مفتوحة المصدر تسمح لمطوري البرامج بدمج إمكانات التعرف البصري على الأحرف (OCR) بسهولة في تطبيقاتهم.

إن PaddleOCR عبارة عن مكتبة Python قوية ومفتوحة المصدر تمكن مطوري البرامج من دمج إمكانات التعرف البصري على الأحرف (OCR) بسهولة في تطبيقات Python الخاصة بهم. وهي مبنية على منصة PaddlePaddle، وهي منصة مفتوحة المصدر للتعلم العميق، وتستخدم نماذج التعلم العميق الحديثة لتحقيق الدقة والأداء العاليين. يعمل PaddleOCR على تبسيط عملية التعرف الضوئي على الحروف من خلال توفير واجهة برمجة التطبيقات (API) عالية المستوى التي تلخص العديد من التفاصيل ذات المستوى المنخفض، مما يسهل على المطورين إضافة إمكانات التعرف الضوئي على الحروف إلى تطبيقاتهم.

قدم PaddleOCR دعمًا كاملاً لمجموعة واسعة من اللغات والبرامج النصية. وهو يدعم حاليًا أكثر من 80 لغة مختلفة، بما في ذلك العربية والصينية والإنجليزية والفرنسية والألمانية واليابانية والكورية والروسية والإسبانية وغيرها الكثير. وهذا يجعلها أداة قيمة للمطورين الذين يحتاجون إلى العمل مع محتوى متعدد اللغات. بالإضافة إلى إمكانيات التعرف الضوئي على الحروف القوية، تتضمن المكتبة أيضًا عددًا من الأدوات المساعدة المفيدة للعمل مع الصور والنصوص. على سبيل المثال، يتضمن أدوات للمعالجة المسبقة للصور، مثل التعديل والتحويل الثنائي، بالإضافة إلى أدوات ما بعد المعالجة لتحسين دقة مخرجات التعرف الضوئي على الحروف.

يوفر PaddleOCR عدة نماذج مختلفة للتعرف الضوئي على الحروف، تم تحسين كل منها لحالات استخدام مختلفة. على سبيل المثال، يتم استخدام نموذج اكتشاف النص لتحديد مناطق النص واستخراجها من صورة ما، بينما يتم استخدام نموذج التعرف على النص للتعرف على النص الفعلي داخل تلك المناطق. هناك أيضًا ميزة Model Ensemble التي تسمح للمطورين بدمج نماذج متعددة لتحقيق دقة أعلى. بشكل عام، تعد PaddleOCR مكتبة قوية وسهلة الاستخدام لإضافة إمكانيات التعرف الضوئي على الحروف إلى تطبيقات Python الخاصة بك. إن دعمه لمجموعة واسعة من اللغات والبرامج النصية، بالإضافة إلى نماذجه القابلة للتخصيص وأدوات المعالجة اللاحقة، يجعله أداة قيمة للمطورين الذين يعملون باستخدام التعرف الضوئي على الحروف.

Previous Next

البدء باستخدام PaddleOCR

الطريقة الموصى بها لتثبيت PaddleOCR هي استخدام النقطة. الرجاء استخدام الأمر التالي للتثبيت السلس

تثبيت PaddleOCR عبر النقطة

 

Install PaddleOCR via pip

 pip install paddleocr 

يمكنك أيضًا تثبيته يدويًا؛ قم بتنزيل أحدث ملفات الإصدار مباشرة من مستودع GitHub.

التعرف على نص الصورة عبر PaddleOCR API

التعرف على نص الصورة هو عملية استخراج النص من الصور. إنها تقنية مفيدة لمختلف التطبيقات مثل مسح المستندات ضوئيًا والرقمنة والتعرف الضوئي على الحروف (OCR). توفر واجهة برمجة تطبيقات التعرف الضوئي على الحروف (OCR) مفتوحة المصدر مجموعة من أحدث نماذج التعرف الضوئي على الحروف (OCR) التي يمكنها التعرف على النص من صور مختلفة، بما في ذلك المستندات الممسوحة ضوئيًا ولقطات الشاشة والصور الفوتوغرافية. تدعم المكتبة العديد من الميزات المهمة المتعلقة بالتعرف على نص الصورة مثل تحميل الصور، وتهيئة نموذج التعرف الضوئي على الحروف (OCR)، وتحديد منطقة النص في الصورة، والتعرف على النص من الصورة، واستخراج النص من النتيجة، وغيرها الكثير. يوضح المثال التالي كيفية التعرف على النص من صورة داخل تطبيقات Python.

إجراء التعرف على نص الصورة داخل مشاريع Python

import paddleocr
ocr = paddleocr.OCR()

# load an image using the PIL
from PIL import Image

image = Image.open('example.jpg')
result = ocr.ocr(image)

# access the recognized text

for line in result:
    print(line[1][0])
    print(line[1][1])

التعرف على مستند التعرف الضوئي على الحروف باستخدام Python API

لقد كان التعرف على المستندات أحد المجالات البحثية البارزة في مجال التعرف الضوئي على الحروف. يتم استخدام المستندات كل يوم تقريبًا في حياتنا. عندما يقوم مطورو البرامج بتطبيق التعرف الضوئي على الحروف (OCR) على مستند ما، فيمكنهم استرداد المعلومات المهمة واسترداد حقول النموذج وتحليل التخطيط والتخزين رقميًا وكذلك لقراءة المخطوطات القديمة. تتيح مكتبة PaddleOCR مفتوحة المصدر لمطوري البرامج تحميل أنواع مختلفة من المستندات وإجراء عمليات التعرف الضوئي على الحروف والتعرف على النص واستخراجه منه باستخدام كود Python. التعرف على النص دقيق للغاية ويمكن للمكتبة بسهولة اكتشاف الأحرف الخاصة والمسافات بدقة.

إجراء التعرف على المستندات باستخدام تقنية التعرف الضوئي على الحروف (OCR) باستخدام Python API

img_path = './input_images/11-document-1.jpg'
result = ocr.ocr(img_path)

//Displaying the output.

دعم التعرف على الجداول داخل تطبيقات Python

تمكن مكتبة PaddleOCR مفتوحة المصدر مطوري البرامج من التعرف على بيانات الجدول داخل تطبيقات Python الخاصة بهم. يحتوي التعرف على الجدول بشكل أساسي على ثلاثة نماذج، اكتشاف نص سطر واحد-DB، التعرف على نص سطر واحد-CRNN وبنية الجدول بالإضافة إلى التنبؤ بإحداثيات الخلية-SLANet. يوضح المثال التالي كيفية التعرف على الصورة التي تحتوي على الجدول. يوضح المثال التالي كيفية استخدام طريقة draw_ocr التي تأخذ الصورة والمربعات المحيطة والنصوص والدرجات والمسار إلى ملف الخط. تقوم بإرجاع صورة بالمربعات المحيطة والنص المكتشف. يمكنك عرض الصورة باستخدام طريقة العرض.

قم بتحميل صورة واكتشف النص بداخلها عبر Python API

from paddleocr import PaddleOCR, draw_ocr

# Load the image that contains the table.

# Load the image
img_path = 'table_image.png'
with open(img_path, 'rb') as f:
    img = f.read()

# Create an instance of the PaddleOCR object
ocr = PaddleOCR()


# Draw the bounding boxes around the detected table cells

boxes = [line[0] for line in result]
scores = [line[1] for line in result]
texts = [line[2][0] for line in result]
im_show = draw_ocr(img, boxes, texts, scores, font_path='arial.ttf')
im_show.show()

 عربي