1. Des produits
  2.   PDF
  3.   Python
  4.   Python-PDFKit
 
  

Générez et gérez des documents PDF via l'API Python gratuite

Bibliothèque Python Open Source pour créer et personnaliser des fichiers PDF, fusionner plusieurs PDF et extraire du texte à partir d'un PDF. Il utilise Wkhtmltopdf Python Wrapper pour convertir du HTML en PDF.

Python est depuis longtemps un langage incontournable pour les développeurs de logiciels et les data scientists en raison de sa simplicité et de sa polyvalence. L’un des nombreux avantages de Python réside dans son riche écosystème de bibliothèques couvrant divers domaines. L'une de ces bibliothèques est Python-PDFKit, un outil puissant pour la manipulation de PDF en Python. Que vous ayez besoin de générer des PDF, d'extraire des informations de fichiers existants ou même de convertir du contenu HTML en PDF, Python-PDFKit est là pour vous. La bibliothèque est très facile à gérer et permet aux utilisateurs de générer des PDF à partir de HTML, d'URL ou de chaînes HTML brutes de manière transparente.

Python-PDFKit est un wrapper Python pour l'outil de conversion PDF populaire, wkhtmltopdf, écrit en C++. Avec cette bibliothèque, les développeurs peuvent facilement intégrer la génération et la manipulation de PDF dans leurs applications Python. La bibliothèque comporte plusieurs fonctionnalités importantes pour gérer les documents PDF via la création de PDF à partir de fichiers HTML, la création de PDF à partir d'URL, la personnalisation du processus de génération de PDF, la conversion directe du contenu HTML en PDF, la fusion de plusieurs documents PDF en un seul fichier, la gestion des audiences PDF. /footers, définition de la taille de la page PDF et bien d'autres encore.

La bibliothèque Python-PDFKit fournit une interface intuitive et simple pour interagir avec l'outil de ligne de commande wkhtmltopdf sous-jacent, permettant aux développeurs de logiciels de créer, fusionner et convertir des documents PDF sans effort. Ses nombreuses options de configuration permettent d'affiner la sortie PDF en fonction d'exigences spécifiques. Avec son processus d'installation simple et son utilisation simple, Python-PDFKit est un ajout précieux à la boîte à outils de tout développeur. En conclusion, Python-PDFKit est une bibliothèque incontournable pour tout développeur Python cherchant à rationaliser les tâches de génération de PDF et à produire facilement des documents d'aspect professionnel.

Previous Next

Premiers pas avec Python-PDFKit

La manière recommandée et la plus simple d'installer Python-PDFKit consiste à utiliser pip. Veuillez utiliser la commande suivante pour une installation fluide.

Installer Python-PDFKit via pip

 pip install pdfkit 

Vous pouvez également l'installer manuellement ; téléchargez les fichiers de la dernière version directement depuis le référentiel GitHub.

Extraire le texte d'un PDF via Python

La bibliothèque Python-PDFKit offre la possibilité d'extraire par programmation du texte à partir de fichiers PDF via Python. Il n'est pas facile de récupérer des données à partir d'un fichier PDF, car la manière dont le PDF stocke les informations rend tout simplement difficile son obtention. Le Python-PDFKit facilite le travail des développeurs en leur fournissant des fonctions intégrées faciles à utiliser pour récupérer des informations. Ils peuvent utiliser la méthode extractText() sur l’objet page pour obtenir le contenu textuel de la page.

Extraire le texte d'un PDF via Python

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

Génération de documents PDF via l'API Python

La bibliothèque open source Python-PDFKit permet aux développeurs de logiciels de générer facilement des fichiers PDF dans leurs applications Python. La bibliothèque prend en charge la génération de PDF à partir de diverses sources. La bibliothèque permet aux développeurs de logiciels de créer des PDF à partir de fichiers HTML, de chaînes ou même d'URL. Il est également possible d'ajouter des images, des en-têtes et des pieds de page, de définir la taille de la page, de définir les marges, etc. dans les applications Python. L'exemple suivant montre comment les développeurs de logiciels peuvent générer des fichiers PDF à partir de diverses sources avec seulement quelques lignes de code Python.

Générer un PDF à partir d'un fichier HTML, d'une chaîne ou d'une URL via l'API Python

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

Personnalisation de la génération PDF dans les applications Python

La bibliothèque open source Python-PDFKit permet aux développeurs de logiciels de personnaliser le processus de génération de PDF dans leurs propres applications. Les développeurs de logiciels peuvent spécifier diverses options telles que la taille de la page, les marges, les en-têtes/pieds de page, la fusion de plusieurs documents PDF, etc. Ces options sont transmises à wkhtmltopdf en tant qu'arguments de ligne de commande. L'exemple suivant montre comment les développeurs de logiciels peuvent personnaliser le processus de génération de PDF dans les applications Python.

Comment personnaliser le processus de génération de PDF via l'API Python ?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

Convertir du HTML en PDF via la bibliothèque Python

La bibliothèque open source Python-PDFKit est une bibliothèque très simple à utiliser pour charger et convertir des documents HTML en fichiers PDF dans leurs applications Python. En plus de générer des PDF, la bibliothèque peut convertir directement le contenu HTML en PDF sans enregistrer de fichier intermédiaire. Cela peut être utile lorsqu'il s'agit de contenu dynamique ou de génération de PDF à la volée. Vous trouverez ci-dessous un exemple simple qui montre comment les programmeurs informatiques peuvent convertir des documents HTML en fichiers PDF dans des applications Python.

 

Comment convertir des documents HTML en fichiers PDF via Python ?

import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 Français