1. מוצרים
  2.   PDF
  3.   Python
  4.   Pdfrw
 
  

ספריית Python בקוד פתוח להמרת קבצי PDF

API חינם של Python מאפשר למפתחים לייצא, לסובב, למזג ולשרשר קבצי PDF, לחלץ נתונים ואלמנטים מקובצי PDF.

pdfrw היא ספריית Python טהורה בקוד פתוח שנותנת למפתחי תוכנה לקרוא ולכתוב קבצי PDF מבלי להתקין תוכנה חיצונית מיוחדת. ספריית התכנות pdfrw היא פשוטה לשימוש וקוד המקור מתועד היטב, פשוט מאוד וקל להבנה. הספרייה כללה תמיכה נאותה ב-Unicode עבור מחרוזות טקסט בקובצי PDF וכן את מנתח ה-PDF הטהור המהיר ביותר של Python.

ספריית pdfrw כוללת תמיכה במספר פעולות PDF חשובות כגון מיזוג קובצי PDF, שינוי מטא נתונים, שרשרת קובצי PDF מרובים יחד, חילוץ תמונות, הדפסת PDF, סיבוב דפי PDF, יצירת PDF חדש, הוספת תמונת PDF עם סימן מים ועוד רבים נוספים.

.

Previous Next

תחילת העבודה עם pdfrw

pdfrw דורש Python 2.6, 2.7, 3.3, 3.4, 3.5 ו-3.6. אתה יכול להתקין pdfrw באמצעות pip. אנא השתמש בפקודה הבאה כדי להתקין אותו.

התקן pdfrw  דרך pip

 python -m pip install pdfrw  

צור מסמכי PDF באמצעות ספריית Python

ספריית pdfrw מספקת למפתחי תוכנה את היכולת ליצור יצירת מסמכי PDF בתוך יישומי Python שלהם עם כמה שורות קוד בלבד. הספרייה מספקת גם תמיכה בגישה ושינוי של קבצי PDF קיימים. אתה יכול בקלות להוסיף דפים חדשים כמו גם רכיבים גרפיים או רכיבי טקסט לתוך PDF הקיים. ספריית pdfrw מספקת תמיכה למציאת הדפים בקובצי PDF שאתה קורא בהם, וכדי לכתוב קבוצה של דפים חזרה לקובץ PDF חדש.

צור ושנה מסמכי PDF באמצעות Python

 // PDF Documents Creation 
  import sys
  import os
  from pdfrw import PdfReader, PdfWriter
  inpfn, = sys.argv[1:]
  outfn = 'alter.' + os.path.basename(inpfn)
  trailer = PdfReader(inpfn)
  trailer.Info.Title = 'My New Title Goes Here'
  PdfWriter(outfn, trailer=trailer).write() 

קריאת קבצי PDF באמצעות Python

ספריית pdfrw מעניקה למפתחי תוכנה לגשת ולקרוא בקלות חלקים שונים של מסמכי PDF בתוך יישומי Python. זה נותן גישה קלה לכל מסמך ה-PDF. הספרייה תומכת באחזור מידע קובץ, גודל ועוד. זה יוצר תכונה מיוחדת בשם דפים, המאפשרת למשתמשים לרשום את כל העמודים של מסמך PDF. זה מאפשר לך לחלץ אובייקט מידע מסמך שבו אתה יכול להשתמש כדי לשלוף מידע כמו מחבר, כותרת וכו '.

גישה וקרא קבצי PDF באמצעות Python

 // Reading PDF Files
  from pdfrw import pdfreader
  def get_pdf_info(path):
    pdf = pdfreader(path)
    print(pdf.keys())
    print(pdf.info)
    print(pdf.root.keys())
    print('pdf has {} pages'.format(len(pdf.pages)))
  if __name__ == '__main__':
    get_pdf_info('w9.pdf')

הוספה או שינוי של מטא נתונים

pdfrw מאפשר למפתחי תוכנה להוסיף או לשנות מטא נתונים של קבצי PDF בתוך יישומי Python שלהם. אתה יכול לשנות פריט מטא-נתונים בודד ב-PDF, לכתוב את התוצאה ל-PDF חדש וכן לכלול מספר קבצים, ולשרשר אותם לאחר הוספת כמה מטא-נתונים לא הגיוניים לקובץ PDF הפלט.

שנה מטא נתונים של PDF באמצעות Python

 // Modifying PDF Metadata
  import sys
  import os
  from pdfrw import PdfReader, PdfWriter
  inpfn, = sys.argv[1:]
  outfn = 'alter.' + os.path.basename(inpfn)
  trailer = PdfReader(inpfn)
  trailer.Info.Title = 'My New Title Goes Here'
  PdfWriter(outfn, trailer=trailer).write() 

פיצול מסמכי PDF

pdfrw מאפשר למפתחי תוכנה לפצל באופן תכנותי מסמכי PDF מסמכים בתוך היישומים שלהם. משתמש עשוי לדרוש לחלץ חלק מסוים של ספר PDF או לחלק אותו למספר קובצי PDF במקום לאחסן אותם בקובץ אחד. זה קל מאוד עם ספריית pdfrw, אתה רק צריך לספק נתיב קובץ PDF לקלט, את מספר העמודים שברצונך לחלץ ואת נתיב הפלט.

פיצול קובץ PDF לקובצי PDF מרובים באמצעות Python

 // Splitting PDF file into multiple pdfs
  from pdfrw import pdfreader, pdfwriter
  def split(path, number_of_pages, output):
    pdf_obj = pdfreader(path)
    total_pages = len(pdf_obj.pages)
    writer = pdfwriter()
    for page in range(number_of_pages):
      if page <= total_pages:
        writer.addpage(pdf_obj.pages[page])
    writer.write(output)
  if __name__ == '__main__':
    split('reportlab-sample.pdf', 10, 'subset.pdf')
 עִברִית