واجهة برمجة تطبيقات Python OCR مفتوحة المصدر لجعل ملفات الصور بتنسيق PDF قابلة للبحث

واجهة برمجة تطبيقات Python OCR مجانية وقوية لأتمتة عملية التعرف الضوئي على الحروف وتسهيل تحويل ملفات PDF للصور الممسوحة ضوئيًا إلى مستندات قابلة للبحث بالكامل بسهولة.

لقد أحدثت تقنية التعرف الضوئي على الحروف (OCR) ثورة في الطريقة التي نتعامل بها مع المستندات ومعالجتها، مما يتيح لنا استخراج المعلومات القيمة بكفاءة. من بين العديد من أدوات التعرف الضوئي على الحروف المتاحة، تبرز OCRmyPDF كمكتبة Python قوية ومتعددة الاستخدامات تجمع بين سهولة الاستخدام والدقة الاستثنائية. OCRmyPDF هي أداة سطر أوامر مفتوحة المصدر ومكتبة Python مصممة خصيصًا لإضافة التعرف الضوئي على الحروف إلى ملفات PDF الموجودة. تقوم المكتبة بتحليل كل صفحة من ملف PDF لتحديد مساحة الألوان والدقة (DPI) اللازمة لالتقاط كافة المعلومات الموجودة على تلك الصفحة دون فقدان المحتوى.

تدعم مكتبة OCRmyPDF مفتوحة المصدر نطاقًا واسعًا من تنسيقات الإدخال، بما في ذلك الصور الممسوحة ضوئيًا وملفات PDF الموجودة وحتى ملفات DjVu. إنه يعمل على أساس "الصورة بالإضافة إلى النص" ويهدف إلى إنتاج مخرجات عالية الجودة من خلال الحفاظ على بنية المستند الأصلي وتنسيقه. تستخدم المكتبة تقنيات تحسين ملفات PDF لتقليل حجم الملف مع الحفاظ على أعلى جودة ممكنة. ومن خلال تطبيق الضغط وأخذ العينات، فإنه يضمن أن ملفات PDF الناتجة التي تم تمكين التعرف الضوئي على الحروف عليها تكون فعالة في التخزين وسرعة التحميل.

يستخدم OCRmyPDF محرك Tesseract OCR القوي، والذي يدعم أكثر من 100 لغة. وتضمن خوارزمياته المتقدمة التعرف الدقيق على النص، حتى من الصور منخفضة الجودة أو المشوهة. قدمت المكتبة الدعم لإنشاء ملف PDF/A قابل للبحث من ملف PDF عادي بسهولة. كما أنه يوفر بعض خيارات معالجة الصور، مثل Deskew، الذي يعمل على تحسين مظهر الملفات وجودة التعرف الضوئي على الحروف. عند استخدامها، يتم تطعيم طبقة التعرف الضوئي على الحروف (OCR) على الصورة المعالجة بدلاً من ذلك. إن مجموعة ميزاته الشاملة، بما في ذلك دعم لغات متعددة وتحسين ملفات PDF والتحكم في طبقة النص والمعالجة الآلية، تجعل منه أداة قيمة للشركات والباحثين وأمناء المحفوظات وأي شخص يتعامل مع كميات كبيرة من المستندات الممسوحة ضوئيًا.

نظرة سريعة

نظرة عامة على ميزات OCRmyPDF.

نظرة عامة على الميزات

إجراء التعرف الضوئي على الحروف
أضف قدرات التعرف الضوئي على الحروف
التعرف على نص الصورة
تحويل صور النص
نص الخط الذي تم التعرف عليه
ابحث في ملف PDF
لغات أخرى
إنشاء تطبيقات التعرف الضوئي على الحروف
حفظ في المتصفح
استخرج النص
دعم تعدد الخيوط

OCRmyPDF

يدعم OCRmyPDF تنسيقات ملفات الصور الشائعة المدرجة أدناه.

قارئ

PNG, JPEG, BMP, TIFF, TGA, DICOM

كاتب

PNG, JPEG, BMP, TIFF

OCRmyPDF

استقلالية النظام الأساسي

يمكن أن يعمل OCRmyPDF مع إصدار Python 2.7 والإصدارات الأحدث.

بايثون 2.7 وما فوق.

OCRmyPDF

البدء باستخدام OCRmyPDF

الطريقة الموصى بها لتثبيت OCRmyPDF هي استخدام النقطة. الرجاء استخدام الأمر التالي للتثبيت السلس.

قم بتثبيت OCRmyPDF عبر النقطة

 pip install ocrmypdf

يمكنك أيضًا تثبيته يدويًا؛ قم بتنزيل أحدث ملفات الإصدار مباشرة من مستودع GitHub.

تحسين ملفات PDF باستخدام Python API

توفر مكتبة OCRmyPDF مفتوحة المصدر دعمًا لميزات مفيدة جدًا لإدارة حجم وجودة مستندات PDF داخل تطبيقات Python. تستخدم المكتبة تقنيات تحسين ملفات PDF لتقليل حجم الملف مع الحفاظ على أعلى جودة ممكنة. من خلال تطبيق الضغط وأخذ العينات، فإنه يضمن أن تكون ملفات PDF الناتجة التي تدعم تقنية التعرف الضوئي على الحروف فعالة في التخزين وسريعة التحميل. يوفر OCRmyPDF العديد من خيارات التحسين التي يمكنك تخصيصها بناءً على متطلباتك. تتضمن بعض الخيارات شائعة الاستخدام إزالة الملفات المؤقتة، وتطبيق ضغط JBIG2، وتخطي إضافة التعرف الضوئي على الحروف، وتعطيل الضغط بدون فقدان البيانات لتقليل حجم الملف إلى أقصى حد، وما إلى ذلك.

كيفية تحسين ملفات PDF باستخدام Python API؟

import subprocess

def optimize_pdf_with_ocrmypdf(input_pdf_path, output_pdf_path):
    try:
        # OCRmyPDF command with optimization options
        command = ['ocrmypdf', '-l', 'eng', '--pdf-renderer', 'hocr', '--optimize', '0', input_pdf_path, output_pdf_path]
        
        # Execute the OCRmyPDF command
        subprocess.run(command, check=True)
        
        print("PDF optimization complete!")
    except subprocess.CalledProcessError as e:
        print(f"OCRmyPDF error: {e}")
        
# Example usage
input_pdf_path = 'input.pdf'
output_pdf_path = 'output.pdf'

optimize_pdf_with_ocrmypdf(input_pdf_path, output_pdf_path)

تكامل طبقة نص PDF عبر Python API

توفر مكتبة OCRmyPDF، وهي مكتبة مفتوحة المصدر، حلاً قويًا لدمج طبقات النص في ملفات PDF، مما يعزز إمكانية الوصول إلى المستندات وإمكانية البحث. تضيف المكتبة طبقة نصية تحتوي على نص تم إنشاؤه بواسطة التعرف الضوئي على الحروف مباشرة على مستند PDF، مما يضمن الحفاظ على التخطيط الأصلي. تتيح هذه الميزة البحث عن النص الكامل والنسخ واللصق واستخراج النص. عند العمل مع مستندات PDF، يعد وجود طبقة نص مدمجة داخل الملف مفيدًا للغاية. تحتوي طبقة النص على النص الذي تم إنشاؤه بواسطة التعرف الضوئي على الحروف، مما يجعل ملف PDF قابلاً للبحث ويسمح بسهولة نسخ النص واستخراجه. يحافظ هذا التكامل على تخطيط المستند الأصلي مع تمكين العمليات المستندة إلى النص، مما يعزز سهولة استخدام المستند وكفاءته.