Δημιουργήστε και διαχειριστείτε έγγραφα PDF μέσω του Free Python API
Βιβλιοθήκη Python ανοιχτού κώδικα για δημιουργία και προσαρμογή αρχείων PDF, συγχώνευση πολλαπλών PDF και εξαγωγή κειμένου από PDF. Χρησιμοποιεί Wkhtmltopdf Python Wrapper για να μετατρέψει HTML σε PDF.
Η Python είναι εδώ και πολύ καιρό μια δημοφιλής γλώσσα για προγραμματιστές λογισμικού και επιστήμονες δεδομένων λόγω της απλότητας και της ευελιξίας της. Ένα από τα πολλά πλεονεκτήματα της Python είναι το πλούσιο οικοσύστημά της από βιβλιοθήκες που καλύπτουν διάφορους τομείς. Μια τέτοια βιβλιοθήκη είναι η Python-PDFKit, ένα ισχυρό εργαλείο για χειρισμό PDF στην Python. Είτε χρειάζεται να δημιουργήσετε PDF, είτε να εξαγάγετε πληροφορίες από υπάρχοντα, είτε ακόμα και να μετατρέψετε περιεχόμενο HTML σε PDF, το Python-PDFKit σας καλύπτει. Η βιβλιοθήκη είναι πολύ εύκολη στον χειρισμό και επιτρέπει στους χρήστες να δημιουργούν αρχεία PDF από HTML, URL ή ακατέργαστες συμβολοσειρές HTML.
Το Python-PDFKit είναι ένα περιτύλιγμα Python για το δημοφιλές εργαλείο μετατροπής PDF, wkhtmltopdf, το οποίο είναι γραμμένο σε C++. Με αυτήν τη βιβλιοθήκη, οι προγραμματιστές μπορούν εύκολα να ενσωματώσουν τη δημιουργία και τη χειραγώγηση PDF στις εφαρμογές Python τους. Υπάρχουν πολλά σημαντικά χαρακτηριστικά που αποτελούν μέρος της βιβλιοθήκης για το χειρισμό εγγράφων PDF μέσω δημιουργίας PDF από αρχεία HTML, δημιουργίας PDF από διευθύνσεις URL, προσαρμογής της διαδικασίας δημιουργίας PDF, απευθείας μετατροπής περιεχομένου HTML σε PDF, συγχώνευσης πολλαπλών εγγράφων PDF σε ένα μόνο αρχείο, διαχείρισης αρχείων PDF /footers, ρύθμιση του μεγέθους σελίδας PDF και πολλά άλλα.
Η βιβλιοθήκη Python-PDFKit παρέχει μια διαισθητική και απλή διεπαφή για αλληλεπίδραση με το υποκείμενο εργαλείο γραμμής εντολών wkhtmltopdf, επιτρέποντας στους προγραμματιστές λογισμικού να δημιουργούν, να συγχωνεύουν και να μετατρέπουν έγγραφα PDF χωρίς κόπο. Οι πολυάριθμες επιλογές διαμόρφωσής του επιτρέπουν τη λεπτομερή ρύθμιση της εξόδου PDF σύμφωνα με συγκεκριμένες απαιτήσεις. Με την εύκολη διαδικασία εγκατάστασης και την απλή χρήση, το Python-PDFKit είναι μια πολύτιμη προσθήκη στην εργαλειοθήκη κάθε προγραμματιστή. Συμπερασματικά, το Python-PDFKit είναι μια βιβλιοθήκη που πρέπει να δοκιμάσει κάθε προγραμματιστής Python που θέλει να βελτιστοποιήσει τις εργασίες δημιουργίας PDF και να παράγει έγγραφα με επαγγελματική εμφάνιση με ευκολία.
Ξεκινώντας με το Python-PDFKit
Ο προτεινόμενος και ευκολότερος τρόπος εγκατάστασης του Python-PDFKit είναι η χρήση του pip. Χρησιμοποιήστε την ακόλουθη εντολή για ομαλή εγκατάσταση.
Εγκαταστήστε το Python-PDFKit μέσω pip
pip install pdfkit
Μπορείτε επίσης να το εγκαταστήσετε με μη αυτόματο τρόπο. κατεβάστε τα αρχεία τελευταίας έκδοσης απευθείας από το αποθετήριο GitHub.
Εξαγωγή κειμένου από PDF μέσω Python
Η βιβλιοθήκη Python-PDFKit παρέχει δυνατότητα εξαγωγής κειμένου από αρχεία PDF μέσω της Python μέσω προγραμματισμού. Δεν είναι εύκολο να ανακτήσετε δεδομένα από ένα αρχείο PDF επειδή ο τρόπος με τον οποίο το PDF αποθηκεύει πληροφορίες απλώς καθιστά δύσκολη την επίτευξή τους. Το Python-PDFKit διευκολύνει τους προγραμματιστές, παρέχοντάς τους εύχρηστες ενσωματωμένες λειτουργίες για την ανάκτηση πληροφοριών. Μπορούν να χρησιμοποιήσουν τη μέθοδο extractText() στο αντικείμενο σελίδας για να λάβουν το περιεχόμενο κειμένου της σελίδας.
Εξαγωγή κειμένου από PDF μέσω Python
// extract text from a PDF
from Python-PDFKit import PdfReader
reader = PdfReader("example.pdf")
page = reader.pages[0]
print(page.extract_text())
Δημιουργία εγγράφων PDF μέσω Python API
Η βιβλιοθήκη ανοιχτού κώδικα Python-PDFKit διευκολύνει τους προγραμματιστές λογισμικού να δημιουργήσουν αρχεία PDF με ευκολία μέσα στις εφαρμογές Python τους. Η βιβλιοθήκη έχει παράσχει υποστήριξη για τη δημιουργία PDF από διάφορες πηγές. Η βιβλιοθήκη επιτρέπει στους προγραμματιστές λογισμικού να δημιουργούν αρχεία PDF από αρχεία HTML, συμβολοσειρές ή ακόμα και διευθύνσεις URL. Είναι επίσης δυνατό να προσθέσετε εικόνες, κεφαλίδες και υποσέλιδα, να ορίσετε το μέγεθος σελίδας, να ορίσετε περιθώρια και ούτω καθεξής μέσα στις εφαρμογές Python. Το παρακάτω παράδειγμα δείχνει πώς οι προγραμματιστές λογισμικού μπορούν να δημιουργήσουν αρχεία PDF από διάφορες πηγές με μόνο μερικές γραμμές κώδικα Python.
Δημιουργία PDF από αρχείο HTML, συμβολοσειρά ή διεύθυνση URL μέσω Python API
import pdfkit
# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")
# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!
"
pdfkit.from_string(html_string, "output.pdf")
# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")
Προσαρμογή της δημιουργίας PDF εντός των εφαρμογών Python
Η βιβλιοθήκη ανοιχτού κώδικα Python-PDFKit επιτρέπει στους προγραμματιστές λογισμικού να προσαρμόσουν τη διαδικασία δημιουργίας PDF μέσα στις δικές τους εφαρμογές. Οι προγραμματιστές λογισμικού μπορούν να καθορίσουν διάφορες επιλογές, όπως μέγεθος σελίδας, περιθώρια, κεφαλίδες/υποσέλιδα, συγχώνευση πολλαπλών εγγράφων PDF και άλλα. Αυτές οι επιλογές μεταβιβάζονται στο wkhtmltopdf ως ορίσματα γραμμής εντολών. Το παρακάτω παράδειγμα δείχνει πώς οι προγραμματιστές λογισμικού μπορούν να προσαρμόσουν τη διαδικασία δημιουργίας PDF μέσα στις εφαρμογές Python.
Πώς να προσαρμόσω τη διαδικασία δημιουργίας PDF μέσω του Python API;
import pdfkit
options = {
'page-size': 'A4',
'margin-top': '0mm',
'margin-right': '0mm',
'margin-bottom': '0mm',
'margin-left': '0mm',
}
pdfkit.from_file("source.html", "output.pdf", options=options)
Μετατροπή HTML σε PDF μέσω βιβλιοθήκης Python
Η βιβλιοθήκη ανοιχτού κώδικα Python-PDFKit είναι μια πολύ εύκολη στη χρήση βιβλιοθήκη για τη φόρτωση και τη μετατροπή εγγράφων HTML σε αρχεία PDF μέσα στις εφαρμογές Python τους. Εκτός από τη δημιουργία αρχείων PDF, η βιβλιοθήκη μπορεί να μετατρέψει περιεχόμενο HTML σε PDF απευθείας χωρίς να αποθηκεύσει ένα ενδιάμεσο αρχείο. Αυτό μπορεί να είναι χρήσιμο όταν ασχολείστε με δυναμικό περιεχόμενο ή όταν δημιουργείτε αρχεία PDF on-the-fly. Παρακάτω είναι ένα απλό παράδειγμα που δείχνει πώς οι προγραμματιστές υπολογιστών μπορούν να μετατρέψουν έγγραφα HTML σε αρχεία PDF μέσα σε εφαρμογές Python.
Πώς να μετατρέψετε έγγραφα HTML σε αρχεία PDF μέσω Python;
import pdfkit
html_string = "Hello, PDFKit!
"
pdf_bytes = pdfkit.from_string(html_string, False)
# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
f.write(pdf_bytes)