1. محصولات
  2.   PDF
  3.   Python
  4.   Pikepdf
 
  

کتابخانه Python منبع باز برای پردازش فایل های PDF

رایگان پایتون API اجازه می دهد تا PDF ها را خطی کرده و به PDF های رمزگذاری شده دسترسی داشته باشید. از ایجاد PDF از ابتدا، کپی کردن صفحات از یک PDF به PDF دیگر، تقسیم یا ادغام PDF و بسیاری موارد دیگر پشتیبانی می کند.

PikePDF یک کتابخانه PDF Python بسیار ساده است که به توسعه دهندگان نرم افزار اجازه می دهد تا با فایل های PDF داخل برنامه های Python کار کنند. این بر اساس QPDF، یک کتابخانه قدرتمند دستکاری و تعمیر PDF است. PikePDF یک کتابخانه تبدیل محتوای PDF است و دسترسی سطح پایین به فایل های PDF را فراهم می کند. این بدان معناست که کاربران به دانش داخلی PDF و آشنایی با مشخصات PDF نیاز دارند. این کتابخانه منبع باز است و تحت مجوز MIT برای استفاده عمومی در دسترس است. این کتابخانه منبع باز است و تحت مجوز MPL-2.0 در دسترس است.

PikePDF از خطی سازی PDF و دسترسی به PDF های رمزگذاری شده پشتیبانی می کند. این شامل مجموعه ای بسیار قدرتمند از ویژگی های مرتبط با مدیریت PDF مانند ایجاد PDF از ابتدا، کپی صفحات از یک PDF به دیگری، تقسیم یا ادغام PDF، استخراج تصویر یا متن از PDF، جایگزینی محتوا در PDF، پشتیبانی تعمیر PDF، صفحه است. پشتیبانی از تنظیمات، مدیریت فراداده PDF، کار با رمز عبور محافظت شده، ویرایش فراداده PDF XMP، تبدیل PDF های موجود و موارد دیگر.

.

Previous Next

شروع کار با PikePDF

PikePDF به پایتون 3.6 و بالاتر نیاز دارد. می توانید PikePDF را با استفاده از pip نصب کنید. لطفا از دستور زیر برای نصب آن استفاده کنید.

PikePDF را از طریق pip نصب کنید

 pip install pikepdf

صفحات را از یک PDF به دیگری از طریق پایتون کپی کنید

کتابخانه منبع باز PikePDF این قابلیت را فراهم می کند که توسعه دهندگان نرم افزار را قادر می سازد تا تنها با چند خط کد پایتون، صفحه را از یک PDF به دیگری کپی کنند. کپی کردن صفحات بین اشیاء PDF یک کپی کم عمق از صفحه منبع در فایل PDF مورد نظر ایجاد می کند و بنابراین تغییر صفحات روی اسناد PDF اصلی تاثیری نخواهد داشت. همچنین امکان جایگزینی صفحات خاص با محتوای سفارشی وجود دارد. همچنین امکان کپی صفحات در یک PDF خاص وجود دارد.

باز کردن و دستکاری اسناد PDF از طریق پایتون

 # PDF Documents Manipulation 
  from pikepdf import Pdf
  new_pdf = Pdf.new()
  with Pdf.open('sample.pdf') as pdf:
    pdf.save('output.pdf') 
   # Copying pages from other PDFs
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  appendix = Pdf.open('../tests/resources/sandwich.pdf')
  pdf.pages.extend(appendix.pages)

تقسیم و ادغام PDF از طریق پایتون

کتابخانه PDF PikePDF به توسعه دهندگان نرم افزار این قدرت را می دهد که به فایل های PDF موجود دسترسی داشته باشند و به راحتی آن را به چندین فایل PDF تقسیم کنند. در حالی که جداسازی PDF تنها چیزی که نیاز داریم این است که PDFهای جدید باید صفحات مقصد را نگه دارند. کتابخانه همچنین مطمئن می شود که داده های مربوط به هر صفحه را منتقل می کند، به طوری که هر صفحه به تنهایی می ایستد. این کتابخانه همچنین شامل پشتیبانی از ادغام یا الحاق چندین سند PDF به یک سند واحد بود. همچنین امکان تغییر ترتیب صفحات PDF تنها با چند خط کد وجود دارد.

تقسیم و ادغام اسناد PDF از طریق پایتون

 # PDF Splitting
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  for n, page in enumerate(pdf.pages):
  dst = Pdf.new()
  dst.pages.append(page)
  dst.save(f'{n:02d}.pdf')
  # Combine Multiple PDF pages into a single One
  from glob import glob
  pdf = Pdf.new()
  for file in glob('*.pdf'):
  src = Pdf.open(file)
  pdf.pages.extend(src.pages)
  pdf.save('merged.pdf')

مدیریت تصاویر داخل سند PDF از طریق پایتون

کتابخانه PDF PikePDF کار توسعه‌دهندگان نرم‌افزار را با استفاده از دستورات پایتون آسان می‌کند. این کتابخانه دارای چندین عملکرد مهم مرتبط با مدیریت تصویر مانند کپی کردن تصاویر در صفحه PDF، باز کردن و مشاهده PDF، تغییر اندازه تصاویر، دستکاری تصاویر در PDF، استخراج تصاویر از PDF، جایگزینی تصاویر، حذف یک تصویر از PDF و بسیاری موارد دیگر است. .

استخراج تصویر و جایگزینی آن در PDF از طریق پایتون

 # Extract Image & Replace PDF Images
  import zlib
  rawimage = pdfimage.obj
  pillowimage = pdfimage.as_pil_image()
  greyscale = pillowimage.convert('L')
  greyscale = greyscale.resize((32, 32))
  rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
  rawimage.ColorSpace = Name("/DeviceGray")
  rawimage.Width, rawimage.Height = 32, 32

مدیریت فراداده PDF از طریق پایتون

فراداده PDF شامل اطلاعات بسیار مفیدی در مورد یک سند PDF مانند نام نویسنده، تاریخ ایجاد و اصلاح، کلمات کلیدی، اطلاعات حق چاپ و غیره است. کتابخانه PDF PikePDF دارای عملکرد کاملی برای دسترسی و خواندن فراداده، استخراج ابرداده، حذف ورودی های فراداده از اسناد PDF است. مثال کد زیر نحوه استخراج ابرداده از اسناد PDF را نشان می دهد.

نحوه استخراج فراداده PDF از طریق پایتون

 # Extract PDF Metadata
  import pikepdf
  import sys
  # get the target pdf file from the command-line arguments
  pdf_filename = sys.argv[1]
  # read the pdf file
  pdf = pikepdf.Pdf.open(pdf_filename)
  docinfo = pdf.docinfo
  for key, value in docinfo.items():
    print(key, ":", value)
 فارسی