افتح مكتبة Python المصدر لتحويل ملفات PDF
تتيح واجهة Python API المجانية للمطورين تصدير ملفات PDF وتدويرها ودمجها وسلسلة ، واستخراج البيانات والعناصر من ملفات PDF.
pdfrw هي مكتبة Python نقية مفتوحة المصدر تتيح لمطوري البرامج قراءة ملفات PDF وكتابتها دون تثبيت أي برنامج خاص خارجي. مكتبة برمجة pdfrw بسيطة جدًا للاستخدام وكود المصدر موثق جيدًا وبسيط جدًا وسهل الفهم. تضمنت المكتبة دعم Unicode المناسب للسلاسل النصية في ملفات PDF بالإضافة إلى أسرع محلل Python PDF نقي.
تتضمن مكتبة pdfrw دعمًا للعديد من عمليات PDF المهمة مثل دمج ملفات PDF وتعديل البيانات الوصفية ودمج ملفات PDF متعددة معًا واستخراج الصور وطباعة PDF وتدوير صفحات PDF وإنشاء ملف PDF جديد وإضافة صورة PDF بعلامة مائية وغير ذلك الكثير.
.
الشروع في العمل مع pdfrw
يتطلب pdfrw لغة Python 2.6 و 2.7 و 3.3 و 3.4 و 3.5 و 3.6. يمكنك تثبيت pdfrw باستخدام النقطة. الرجاء استخدام الأمر التالي لتثبيته.
قم بتثبيت pdfrw عبر النقطة
python -m pip install pdfrw
قم بإنشاء مستندات PDF عبر مكتبة Python
توفر مكتبة pdfrw لمطوري البرامج القدرة على إنشاء مستندات PDF داخل تطبيقات Python الخاصة بهم ببضع سطرين من التعليمات البرمجية. توفر المكتبة أيضًا دعمًا للوصول إلى ملفات PDF الموجودة وتعديلها. يمكنك بسهولة إدراج صفحات جديدة بالإضافة إلى مكونات رسومات أو عناصر نصية في ملف PDF الحالي. توفر مكتبة pdfrw الدعم للعثور على الصفحات الموجودة في ملفات PDF التي تقرأها ، ولإعادة كتابة مجموعة من الصفحات إلى ملف PDF جديد.
قم بإنشاء وتعديل مستندات PDF عبر Python
// PDF Documents Creation
import sys
import os
from pdfrw import PdfReader, PdfWriter
inpfn, = sys.argv[1:]
outfn = 'alter.' + os.path.basename(inpfn)
trailer = PdfReader(inpfn)
trailer.Info.Title = 'My New Title Goes Here'
PdfWriter(outfn, trailer=trailer).write()
قراءة ملفات PDF عبر Python
تتيح مكتبة pdfrw لمطوري البرامج الوصول بسهولة إلى أجزاء مختلفة من مستندات PDF وقراءتها داخل تطبيقات Python. إنه يوفر وصولاً سهلاً إلى مستند PDF بأكمله. تدعم المكتبة استرداد معلومات الملف وحجمه والمزيد. يقوم بإنشاء سمة خاصة تسمى الصفحات ، والتي تتيح للمستخدمين سرد جميع صفحات مستند PDF. يتيح لك استخراج كائن معلومات المستند الذي يمكنك استخدامه لسحب معلومات مثل المؤلف والعنوان وما إلى ذلك.
الوصول إلى ملفات PDF وقراءتها عبر Python
// Reading PDF Files
from pdfrw import pdfreader
def get_pdf_info(path):
pdf = pdfreader(path)
print(pdf.keys())
print(pdf.info)
print(pdf.root.keys())
print('pdf has {} pages'.format(len(pdf.pages)))
if __name__ == '__main__':
get_pdf_info('w9.pdf')
إضافة أو تعديل البيانات الوصفية
يسمح pdfrw لمطوري البرامج بإضافة أو تعديل البيانات الوصفية لملفات PDF داخل تطبيقات Python الخاصة بهم. يمكنك تغيير عنصر بيانات أولية واحد في ملف PDF ، وكتابة النتيجة إلى ملف PDF جديد وكذلك تضمين ملفات متعددة ، وربطها بعد إضافة بعض البيانات الأولية غير المنطقية إلى ملف PDF الناتج.
تعديل بيانات تعريف PDF عبر Python
// Modifying PDF Metadata
import sys
import os
from pdfrw import PdfReader, PdfWriter
inpfn, = sys.argv[1:]
outfn = 'alter.' + os.path.basename(inpfn)
trailer = PdfReader(inpfn)
trailer.Info.Title = 'My New Title Goes Here'
PdfWriter(outfn, trailer=trailer).write()
تقسيم مستندات PDF
يسمح pdfrw لمطوري البرامج بتقسيم مستندات PDF برمجيًا داخل تطبيقاتهم. قد يطلب المستخدم استخراج جزء معين من كتاب PDF أو تقسيمه إلى عدة ملفات PDF بدلاً من تخزينها في ملف واحد. من السهل جدًا استخدام مكتبة pdfrw ، ما عليك سوى توفير مسار ملف PDF للإدخال وعدد الصفحات التي تريد استخراجها ومسار الإخراج.
تقسيم ملف PDF إلى ملفات PDF متعددة عبر Python
// Splitting PDF file into multiple pdfs
from pdfrw import pdfreader, pdfwriter
def split(path, number_of_pages, output):
pdf_obj = pdfreader(path)
total_pages = len(pdf_obj.pages)
writer = pdfwriter()
for page in range(number_of_pages):
if page <= total_pages:
writer.addpage(pdf_obj.pages[page])
writer.write(output)
if __name__ == '__main__':
split('reportlab-sample.pdf', 10, 'subset.pdf')