1. מוצרים
  2.   PDF
  3.   Python
  4.   Python-PDFKit
 
  

צור ונהל מסמכי PDF באמצעות Python API בחינם

ספריית קוד פתוח של Python ליצירה והתאמה אישית של קובצי PDF, מיזוג קובצי PDF מרובים וחילוץ טקסט מ-PDF. הוא משתמש ב-Wkhtmltopdf Python Wrapper כדי להמיר HTML ל-PDF.

Python היא כבר זמן רב שפה חשובה עבור מפתחי תוכנה ומדעני נתונים בשל הפשטות והרבגוניות שלה. אחד היתרונות הרבים של Python הוא המערכת האקולוגית העשירה שלו של ספריות המכסות תחומים שונים. ספרייה אחת כזו היא Python-PDFKit, כלי רב עוצמה למניפולציה של PDF ב-Python. בין אם אתה צריך ליצור קובצי PDF, לחלץ מידע מקבצים קיימים, או אפילו להמיר תוכן HTML ל-PDF, Python-PDFKit סיפק אותך. הספרייה קלה מאוד לטיפול ומאפשרת למשתמשים ליצור קובצי PDF מ-HTML, URL או מחרוזות HTML גולמיות בצורה חלקה.

Python-PDFKit הוא מעטפת Python עבור כלי המרת PDF הפופולרי, wkhtmltopdf, שנכתב ב-C++. עם ספרייה זו, מפתחים יכולים לשלב בקלות יצירת PDF ומניפולציה ביישומי Python שלהם. ישנם מספר מאפיינים חשובים של הספרייה לטיפול במסמכי PDF באמצעות יצירת קובצי PDF מקובצי HTML, יצירת קובצי PDF מכתובות URL, התאמה אישית של תהליך יצירת PDF, המרת תוכן HTML ל-PDF ישירות, מיזוג מסמכי PDF מרובים לקובץ אחד, ניהול שומע PDF /footers, הגדרת גודל עמוד ה-PDF ועוד רבים נוספים.

ספריית Python-PDFKit מספקת ממשק אינטואיטיבי ופשוט לאינטראקציה עם כלי שורת הפקודה הבסיסי wkhtmltopdf, המאפשרת למפתחי תוכנה ליצור, למזג ולהמיר מסמכי PDF ללא מאמץ. אפשרויות התצורה הרבות שלו מאפשרות כוונון עדין של פלט PDF בהתאם לדרישות ספציפיות. עם תהליך ההתקנה הקל והשימוש הפשוט שלו, Python-PDFKit הוא תוספת חשובה לכל ערכת כלים של מפתחים. לסיכום, Python-PDFKit היא ספריית חובה לנסות עבור כל מפתח Python המעוניין לייעל את משימות יצירת PDF ולהפיק מסמכים בעלי מראה מקצועי בקלות.

Previous Next

תחילת העבודה עם Python-PDFKit

הדרך המומלצת והקלה ביותר להתקין את Python-PDFKit היא באמצעות pip. אנא השתמש בפקודה הבאה להתקנה חלקה.

התקן Python-PDFKit  באמצעות pip

 pip install pdfkit 

תוכל גם להתקין אותו באופן ידני; הורד את קבצי הגרסה העדכניים ביותר ישירות ממאגר GitHub.

חלץ טקסט מ-PDF באמצעות Python

ספריית Python-PDFKit מספקת יכולת לחילוץ טקסט מקבצי PDF באמצעות Python. זה לא קל לאחזר נתונים מקובץ PDF מכיוון שהאופן שבו PDF מאחסן מידע פשוט מקשה על השגתו. Python-PDFKit מקל על מפתחים בכך שהוא מספק להם פונקציות מובנות קלות לשימוש לאחזור מידע. הם יכולים להשתמש בשיטת extractText() באובייקט העמוד כדי לקבל את תוכן הטקסט של העמוד.

חלץ טקסט מ-PDF באמצעות Python

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

יצירת מסמכי PDF באמצעות Python API

ספריית הקוד הפתוח Python-PDFKit מקלה על מפתחי תוכנה ליצור קובץ PDF בקלות בתוך יישומי Python שלהם. הספרייה סיפקה תמיכה להפקת קובצי PDF ממקורות שונים. הספרייה מאפשרת למפתחי תוכנה ליצור קובצי PDF מקובצי HTML, מחרוזות או אפילו כתובות URL. אפשר גם להוסיף תמונות, כותרות עליונות ותחתונות, להגדיר גודל עמוד, להגדיר שוליים וכן הלאה בתוך יישומי Python. הדוגמה הבאה מדגימה כיצד מפתחי תוכנה יכולים ליצור קבצי PDF ממקורות שונים עם קוד Python של כמה שורות בלבד.

צור PDF מקובץ HTML, מחרוזת או כתובת אתר באמצעות Python API

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

התאמה אישית של יצירת PDF בתוך Python Apps

ספריית הקוד הפתוח Python-PDFKit מאפשרת למפתחי תוכנה להתאים אישית את תהליך יצירת PDF בתוך היישומים שלהם. מפתחי תוכנה יכולים לציין אפשרויות שונות כגון גודל עמוד, שוליים, כותרות עליונות/תחתונות, מיזוג מסמכי PDF מרובים ועוד. אפשרויות אלו מועברות אל wkhtmltopdf כארגומנטים של שורת הפקודה. הדוגמה הבאה מראה כיצד מפתחי תוכנה יכולים להתאים אישית את תהליך יצירת PDF בתוך יישומי Python.

כיצד להתאים אישית את תהליך יצירת PDF באמצעות Python API?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

המר HTML ל-PDF באמצעות ספריית Python

ספריית הקוד הפתוח Python-PDFKit היא ספרייה קלה מאוד לשימוש לטעינה והמרת מסמכי HTML לקובצי PDF בתוך יישומי Python שלהם. מלבד הפקת קובצי PDF, הספרייה יכולה להמיר תוכן HTML ל-PDF ישירות מבלי לשמור קובץ ביניים. זה יכול להיות שימושי בעת התמודדות עם תוכן דינמי או יצירת קובצי PDF תוך כדי תנועה. להלן דוגמה פשוטה שמראה כיצד מתכנתי מחשבים יכולים להמיר מסמכי HTML לקבצי PDF בתוך יישומי Python.

 

כיצד להמיר מסמכי HTML לקובצי PDF באמצעות Python?

import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 עִברִית