1. منتجات
  2.   OCR
  3.   Python
  4.   EasyOCR
 
  

واجهة برمجة تطبيقات Python المجانية لدمج قدرات التعرف الضوئي على الحروف واستخراج النص

واجهة برمجة تطبيقات Python OCR مفتوحة المصدر للتعرف الدقيق والسريع على النص من الصور والمستندات. اقرأ كلاً من نص المشهد الطبيعي والنص الكثيف في المستند باستخدام مكتبة بايثون.

لقد كانت تقنية التعرف الضوئي على الحروف (OCR) موجودة منذ فترة، ويتم استخدامها في العديد من الصناعات لأتمتة مهام إدخال البيانات ومعالجة المستندات. EasyOCR هو محرك مفتوح المصدر للتعرف الضوئي على الحروف (OCR)، وهو سريع ودقيق وسهل الاستخدام. فهو يوفر واجهة سهلة الاستخدام للمطورين لدمج التعرف الضوئي على الحروف في تطبيقاتهم. باستخدام مكتبة EasyOCR، يستطيع مطورو البرامج استخراج النص من الصور والمستندات الممسوحة ضوئيًا في غضون ثوانٍ، مما يجعلها أداة مثالية لإدارة المستندات واستخراج البيانات والأتمتة.

تمت كتابة EasyOCR بلغة Python ويدعم أكثر من 80 لغة، مما يجعله أداة قوية للشركات العاملة في بيئات متعددة اللغات. هناك العديد من الميزات المهمة الموجودة في المكتبة مثل الاستخراج الدقيق للنصوص، والدعم متعدد اللغات، والتكامل البسيط مع التطبيقات الموجودة، وتخصيص محرك التعرف الضوئي على الحروف لتلبية احتياجاتك الخاصة، والحلول الفعالة من حيث التكلفة، واستخراج النص من المستندات الممسوحة ضوئيًا، والاستلام والتخزين. النص المستخرج، وغيرها الكثير. واجهة برمجة التطبيقات (API) عبارة عن حل قائم على السحابة ولا يتطلب تثبيت أي أجهزة أو برامج، مما يجعلها حلاً فعالاً من حيث التكلفة للشركات بجميع أحجامها.

تستخدم واجهة EasyOCR API خوارزميات التعلم العميق لتحقيق معدلات دقة عالية ويمكنها معالجة كميات كبيرة من البيانات بسرعة. إنه حل مرن وقابل للتطوير ويمكن دمجه في سير العمل الحالي باستخدام واجهة برمجة تطبيقات RESTful البسيطة. يعد EasyOCR API أحد حلول التعرف الضوئي على الحروف القوية التي يمكنها مساعدة الشركات من جميع الأحجام على أتمتة عمليات إدخال البيانات الخاصة بها وتحسين الدقة وتقليل التكاليف. مع دعم لغات متعددة، فهي أداة مثالية لإدارة المستندات واستخراج البيانات والأتمتة. إذا كنت تبحث عن محرك OCR لدمجه في تطبيقك، فجرّب EasyOCR.

Previous Next

البدء باستخدام EasyOCR

الطريقة الموصى بها لتثبيت EasyOCR هي استخدام النقطة. الرجاء استخدام الأمر التالي للتثبيت السلس.

قم بتثبيت EasyOCR عبر النقطة

 pip install easyocr 

يمكنك أيضًا تثبيته يدويًا؛ قم بتنزيل أحدث ملفات الإصدار مباشرةً من مستودع GitHub.

قراءة النص واستخراجه من الصورة عبر Python API

تستخدم واجهة EasyOCR API مفتوحة المصدر خوارزميات التعلم العميق لتحميل النص والتعرف عليه واستخراجه من الصور وملفات PDF داخل تطبيقات Python. يمكن لـ EasyOCR قراءة لغات متعددة في نفس الوقت ولكن يجب أن تكون متوافقة مع بعضها البعض. اللغات التي تشترك في معظم الأحرف (مثل النص اللاتيني) مع بعضها البعض متوافقة. تسمح واجهة برمجة التطبيقات (API) بقراءة النص واستخراجه من الصور، بما في ذلك كيفية المعالجة المسبقة للصور وضبط معلمات محرك التعرف الضوئي على الحروف (OCR) لتحسين الدقة. يوضح المثال التالي كيفية قراءة النص واستخراجه من الصور وأتمتة مهام إدخال البيانات بسهولة.

قراءة واستخراج النص من الصور عبر Python API

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')

# Use the OCR engine to extract text from the image.

result = reader.readtext(image, detail=0)

التعرف على الأحرف من مربعات النص عبر Python API

يعد التعرف على الأحرف من مربعات النص حالة استخدام شائعة لمحركات التعرف الضوئي على الحروف. توفر واجهة برمجة تطبيقات EasyOCR مفتوحة المصدر حلاً قويًا وسهل الاستخدام لحالة الاستخدام هذه. فهو يساعد مطوري البرامج على التعرف على الأحرف من مربعات النص بسهولة وكيفية المعالجة المسبقة للصور وضبط معلمات محرك التعرف الضوئي على الحروف لتحسين الدقة. يمكن أن يكون لمربعات النص أشكال وأحجام واتجاهات مختلفة، وقد يؤثر ذلك على دقة محرك التعرف الضوئي على الحروف. لذا فإن تطبيق بعض خطوات المعالجة المسبقة يمكن أن يؤدي إلى تحسين دقة محرك التعرف الضوئي على الحروف، مثل تعديل الصورة وتطبيق الثنائية وتطبيق تقليل الضوضاء.

كيفية التعرف على الأحرف من مربعات النص عبر Python API؟

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')

# OCR engine to recognize the characters in the text box

result = reader.readtext(image, detail=0)

# The result is a list of strings, where each string represents a recognized character in the text box.

 عربي