افتح مكتبة Python المصدر لمعالجة ملفات PDF

تسمح واجهة برمجة تطبيقات Python المجانية بوضع ملفات PDF خطية والوصول إلى ملفات PDF المشفرة. وهو يدعم إنشاء ملفات PDF من البداية ، ونسخ الصفحات من ملف PDF إلى آخر ، وتقسيم أو دمج ملفات PDF وغيرها الكثير.

PikePDF هي مكتبة Python PDF بسيطة للغاية تتيح لمطوري البرامج العمل مع ملفات PDF داخل تطبيقات Python. يعتمد على QPDF ، مكتبة قوية لمعالجة وإصلاح ملفات PDF. PikePDF هي مكتبة تحويل محتوى PDF وتوفر وصولاً منخفض المستوى إلى ملفات PDF. هذا يعني أن المستخدمين بحاجة إلى معرفة العناصر الداخلية لملف PDF والإلمام بمواصفات PDF. المكتبة مفتوحة المصدر ومتاحة بموجب ترخيص معهد ماساتشوستس للتكنولوجيا للاستخدام العام. المكتبة مفتوحة المصدر ومتاحة بموجب ترخيص MPL-2.0.

يوفر PikePDF دعمًا لخطي ملفات PDF والوصول إلى ملفات PDF المشفرة. لقد تضمنت مجموعة قوية جدًا من الميزات المتعلقة بإدارة PDF مثل إنشاء PDF من البداية ، ونسخ الصفحات من ملف PDF إلى آخر ، وتقسيم أو دمج ملفات PDF ، واستخراج الصور أو النص من PDF ، واستبدال المحتوى في PDF ، ودعم إصلاح PDF ، والصفحة دعم الإعدادات ، وإدارة البيانات الأولية لـ PDF ، والعمل مع المحمية بكلمة مرور ، وتحرير البيانات الأولية لـ PDF XMP ، وتحويل ملفات PDF الموجودة والمزيد.

لمحة سريعة

نظرة عامة على ميزات PikePDF.

نظرة عامة على الميزات

إنشاء ملف PDF
نسخ صفحات PDF
استخراج الصور
إصلاح ملفات PDF
استخراج النص
تقسيم ملفات PDF
دمج ملفات PDF
تدوير ملفات PDF
ملفات PDF المتسلسلة
تضمين الارتباطات التشعبية
أدخل الدوائر
أضف أشكالًا معقدة
استبدال المحتوى
استخراج البيانات
تقنين النص
نموذج PDF
تضمين الصور

بايك بدف

يدعم PikePDF تنسيق ملف PDF بالإضافة إلى تنسيقات الصناعة القياسية للتصدير.

قارئ

كاتب

TXT, HTML

بايك بدف

منصة الاستقلال

تم اختبار PikePDF باستخدام Python 3.6 والإصدارات الأحدث.

Python 3.6 والإصدارات الأحدث

بايك بدف

الشروع في العمل مع PikePDF

يتطلب PikePDF بايثون 3.6 وأعلى. يمكنك تثبيت PikePDF باستخدام النقطة. الرجاء استخدام الأمر التالي لتثبيته.

قم بتثبيت PikePDF عبر النقطة

 pip install pikepdf

انسخ الصفحات من ملف PDF إلى آخر عبر Python

توفر مكتبة PikePDF مفتوحة المصدر القدرة التي تمكن مطوري البرامج من مشاركة الصفحة من ملف PDF إلى آخر ببضعة سطرين فقط من كود Python. سيؤدي نسخ الصفحات بين كائنات PDF إلى إنشاء نسخة سطحية من الصفحة المصدر داخل ملف PDF الهدف وبالتالي لن يؤثر تعديل الصفحات على مستندات PDF الأصلية. من الممكن أيضًا استبدال صفحات معينة بمحتوى مخصص. من الممكن أيضًا نسخ الصفحات داخل ملف PDF معين.

افتح مستندات PDF وتعالجها عبر Python

 # PDF Documents Manipulation 
  from pikepdf import Pdf
  new_pdf = Pdf.new()
  with Pdf.open('sample.pdf') as pdf:
    pdf.save('output.pdf') 
   # Copying pages from other PDFs
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  appendix = Pdf.open('../tests/resources/sandwich.pdf')
  pdf.pages.extend(appendix.pages)

تقسيم ودمج ملفات PDF عبر Python

تمنح مكتبة PDF PikePDF مطوري البرامج القدرة على الوصول إلى ملفات PDF الموجودة وتقسيمها إلى ملفات PDF متعددة بسهولة. أثناء تقسيم PDF ، كل ما نطلبه هو أن ملفات PDF الجديدة يجب أن تحتوي على صفحات الوجهة. تتأكد المكتبة أيضًا من نقل البيانات المرتبطة بكل صفحة ، بحيث تقف كل صفحة بمفردها. تضمنت المكتبة أيضًا دعمًا لدمج أو دمج مستندات PDF متعددة في مستند واحد. من الممكن أيضًا عكس ترتيب صفحات PDF ببضع سطرين من التعليمات البرمجية.

انقسام ودمج مستندات PDF عبر Python

 # PDF Splitting
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  for n, page in enumerate(pdf.pages):
  dst = Pdf.new()
  dst.pages.append(page)
  dst.save(f'{n:02d}.pdf')
  # Combine Multiple PDF pages into a single One
  from glob import glob
  pdf = Pdf.new()
  for file in glob('*.pdf'):
  src = Pdf.open(file)
  pdf.pages.extend(src.pages)
  pdf.save('merged.pdf')

إدارة الصور داخل مستند PDF عبر Python

تسهل مكتبة PDF PikePDF على مطوري البرامج التعامل مع الصور داخل ملف PDF باستخدام أوامر Python. تضمنت المكتبة العديد من الوظائف المهمة المتعلقة بمعالجة الصور مثل نسخ الصور داخل صفحة PDF وفتح ملف PDF وعرضه وتغيير حجم الصور ومعالجة الصور في ملف PDF واستخراج الصور من PDF واستبدال الصور وحذف صورة من PDF وغير ذلك الكثير .

استخراج الصورة واستبدالها في PDF عبر Python

 # Extract Image & Replace PDF Images
  import zlib
  rawimage = pdfimage.obj
  pillowimage = pdfimage.as_pil_image()
  greyscale = pillowimage.convert('L')
  greyscale = greyscale.resize((32, 32))
  rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
  rawimage.ColorSpace = Name("/DeviceGray")
  rawimage.Width, rawimage.Height = 32, 32

معالجة بيانات تعريف PDF عبر Python

تتضمن البيانات الوصفية في PDF معلومات مفيدة جدًا حول مستند PDF مثل اسم المؤلف وتاريخ الإنشاء والتعديل والكلمات الرئيسية ومعلومات حقوق النشر وما إلى ذلك. تضمنت مكتبة PDF PikePDF وظائف كاملة للوصول إلى البيانات الوصفية وقراءتها ، واستخراج البيانات الوصفية ، وحذف إدخالات البيانات الوصفية من مستندات PDF. يوضح مثال الكود التالي كيفية استخراج البيانات الأولية من مستندات PDF.

كيفية استخراج بيانات تعريف PDF عبر Python

 # Extract PDF Metadata
  import pikepdf
  import sys
  # get the target pdf file from the command-line arguments
  pdf_filename = sys.argv[1]
  # read the pdf file
  pdf = pikepdf.Pdf.open(pdf_filename)
  docinfo = pdf.docinfo
  for key, value in docinfo.items():
    print(key, ":", value)