مكتبة روبي المجانية المتقدمة لتحميل واستخراج النص من الصور

واجهة برمجة تطبيقات Ruby OCR الرائدة مفتوحة المصدر ومحول الصور إلى النص الذي يسمح لمطوري البرامج بتحميل النص والتعرف عليه واستخراجه من الصور (الصور الممسوحة ضوئيًا وملفات PDF).

يعد التعرف الضوئي على الحروف (OCR) تقنية فعالة تمكن أجهزة الكمبيوتر من التعرف على النص واستخراجه من الصور أو المستندات الممسوحة ضوئيًا. وله العديد من التطبيقات، بدءًا من رقمنة المواد المطبوعة إلى أتمتة عمليات إدخال البيانات. في لغة برمجة روبي، إحدى المكتبات الشائعة للتعرف الضوئي على الحروف هي Ruby-Tesseract-OCR. Ruby-Tesseract-OCR عبارة عن جوهرة روبي تعمل بمثابة غلاف لمحرك Tesseract OCR. Tesseract هو محرك مفتوح المصدر للتعرف الضوئي على الحروف تم تطويره بواسطة Google ويشتهر بالدقة ودعم اللغة.

يتجاوز Ruby-Tesseract-OCR إمكانات التعرف الضوئي على الحروف الأساسية ويوفر ميزات إضافية لحالات الاستخدام المتقدمة. على سبيل المثال، يمكن لمطوري البرامج تحديد منطقة الاهتمام (ROI) داخل الصورة لقصر تحليل التعرف الضوئي على الحروف على منطقة معينة. يعد هذا مفيدًا بشكل خاص عند التعامل مع المستندات المعقدة أو عندما تحتاج فقط إلى استخراج النص من قسم معين. توفر المكتبة العديد من الميزات الإضافية لتعزيز قدرات التعرف الضوئي على الحروف (OCR)، مثل تحميل صورة موجودة، واستخراج النص من الصور أو المستندات الممسوحة ضوئيًا، والحصول على مخرجات HOCR (HTML OCR)، وغير ذلك الكثير.

توفر جوهرة Ruby-Tesseract-OCR واجهة سهلة الاستخدام للتفاعل مع محرك Tesseract، مما يتيح لمطوري Ruby دمج إمكانات التعرف الضوئي على الحروف في مشاريعهم دون عناء. سواء كنت بحاجة إلى استخراج المعلومات من الفواتير، أو تحويل المواد المطبوعة إلى صيغة رقمية، أو أتمتة مهام إدخال البيانات، فإن المكتبة مفتوحة المصدر توفر حلاً موثوقًا وفعالاً. جرّبها واطلق العنان لإمكانات التعرف الضوئي على الحروف في مشاريع Ruby الخاصة بك اليوم.

نظرة سريعة

نظرة عامة على ميزات Ruby-Tesseract-OCR.

نظرة عامة على الميزات

إجراء التعرف الضوئي على الحروف
أضف قدرات التعرف الضوئي على الحروف
التعرف على نص الصورة
تحميل الصور عبر عنوان URL
تحويل نص PDF
نص الخط الذي تم التعرف عليه
ابحث في ملف PDF
لغات أخرى
إنشاء تطبيقات التعرف الضوئي على الحروف
حفظ في المتصفح
استخرج النص
دعم تعدد الخيوط

Ruby-Tesseract-OCR

يدعم Ruby-Tesseract-OCR تنسيقات ملفات OCR الشائعة المدرجة أدناه.

قارئ

PNG, JPEG, BMP, TIFF, TGA, DICOM

كاتب

PNG, JPEG, BMP, TIFF

Ruby-Tesseract-OCR

استقلالية النظام الأساسي

يتطلب Ruby-Tesseract-OCR فقط Ruby Runtime.

روبي 5.1 وما فوق.

Ruby-Tesseract-OCR

البدء باستخدام Ruby-Tesseract-OCR

الطريقة الموصى بها لتثبيت Ruby-Tesseract-OCR هي استخدام Rubygems. الرجاء استخدام الأمر التالي للتثبيت السلس.

قم بتثبيت Ruby-Tesseract-OCR عبر Rubygems

gem install tesseract-ocr

يمكنك تنزيل المكتبة المشتركة المجمعة من مستودع Github.

استخرج النص من الصور والمستندات الممسوحة ضوئيًا عبر روبي

Ruby-Tesseract-OCR هي مكتبة قوية جدًا مفتوحة المصدر تتيح لمطوري البرامج تحميل واستخراج النص من أنواع مختلفة من الصور باستخدام سطرين فقط من كود Ruby. تسهل المكتبة استخراج النص من الصور أو ملفات PDF أو المستندات الممسوحة ضوئيًا. يتضمن سير العمل النموذجي تحميل صورة، وتكوين معلمات التعرف الضوئي على الحروف، واستدعاء محرك التعرف الضوئي على الحروف للتعرف على النص. لإجراء عملية ناجحة، يحتاج المطورون إلى توفير المسار إلى الصورة التي يريدون معالجتها واستدعاء الأسلوب text_for لاستخراج النص. وأخيرا، سيتم طباعة النتيجة على وحدة التحكم. توفر المكتبة خيارات Fconfiguration متنوعة للتحكم في سلوك التعرف الضوئي على الحروف، مثل وضع تجزئة الصفحة، وأحرف القائمة البيضاء، والمزيد. توضح الأمثلة التالية كيف يمكن لمطوري البرامج تحميل صورة JPEG واستخراج النص منها داخل تطبيقات Ruby.

كيفية استخراج النص من الصور باستخدام أوامر روبي؟

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

e.text_for('test/first.png').strip # => 'ABC'

استخرج النص من منطقة صورة معينة عبر روبي

تتجاوز مكتبة Ruby-Tesseract-OCR مفتوحة المصدر إمكانات التعرف الضوئي على الحروف الأساسية وتقدم ميزات إضافية لحالات الاستخدام المتقدمة. على سبيل المثال، يمكن للمستخدمين تحديد منطقة الاهتمام (ROI) داخل الصورة لقصر تحليل التعرف الضوئي على الحروف على منطقة معينة. يعد هذا مفيدًا بشكل خاص عند التعامل مع المستندات المعقدة أو عندما يحتاج المستخدمون فقط إلى استخراج النص من قسم معين. بالإضافة إلى ذلك، توفر المكتبة طرقًا للحصول على مخرجات HOCR (HTML OCR)، والتي لا تتضمن فقط النص الذي تم التعرف عليه ولكن أيضًا معلومات حول تخطيط وإحداثيات عناصر النص. يعد إخراج HOCR مفيدًا عندما تحتاج إلى المزيد من البيانات الدقيقة أو ترغب في إجراء مزيد من التحليل على بنية النص.

كيفية تنفيذ hOCR على صورة عبر مكتبة روبي؟

require 'tesseract'

e = Tesseract::Engine.new {|e|
  e.language  = :eng
  e.blacklist = '|'
}

puts e.hocr_for('test/first.png')