1. Produse
  2.   PDF
  3.   Python
  4.   Python-PDFKit
 
  

Generați și gestionați documente PDF prin intermediul API-ului Python gratuit

Biblioteca Open Source Python pentru crearea și personalizarea fișierelor PDF, îmbinare mai multe PDF-uri și extrage text din PDF. Utilizează Wkhtmltopdf Python Wrapper pentru a converti HTML în PDF.

Python a fost de mult timp un limbaj preferat pentru dezvoltatorii de software și oamenii de știință de date datorită simplității și versatilității sale. Unul dintre numeroasele avantaje ale Python este ecosistemul său bogat de biblioteci care acoperă diverse domenii. O astfel de bibliotecă este Python-PDFKit, un instrument puternic pentru manipularea PDF-ului în Python. Indiferent dacă aveți nevoie să generați PDF-uri, să extrageți informații din cele existente sau chiar să convertiți conținut HTML în PDF, Python-PDFKit vă oferă acoperire. Biblioteca este foarte ușor de manevrat și permite utilizatorilor să genereze PDF-uri din HTML, URL sau șiruri HTML brute fără probleme.

Python-PDFKit este un wrapper Python pentru popularul instrument de conversie PDF, wkhtmltopdf, care este scris în C++. Cu această bibliotecă, dezvoltatorii pot integra cu ușurință generarea și manipularea PDF în aplicațiile lor Python. Există mai multe caracteristici importante ale bibliotecii pentru manipularea documentelor PDF prin crearea de PDF-uri din fișiere HTML, crearea de PDF-uri din URL-uri, personalizarea procesului de generare PDF, conversia directă a conținutului HTML în PDF, îmbinarea mai multor documente PDF într-un singur fișier, gestionarea audierilor PDF /footers, setarea dimensiunii paginii PDF și multe altele.

Biblioteca Python-PDFKit oferă o interfață intuitivă și simplă pentru a interacționa cu instrumentul de linie de comandă wkhtmltopdf subiacent, permițând dezvoltatorilor de software să creeze, să îmbine și să convertească documente PDF fără efort. Numeroasele sale opțiuni de configurare permit reglarea fină a ieșirii PDF în funcție de cerințele specifice. Cu procesul său ușor de instalare și utilizarea simplă, Python-PDFKit este un plus valoros la setul de instrumente al oricărui dezvoltator. În concluzie, Python-PDFKit este o bibliotecă de încercat obligatoriu pentru orice dezvoltator Python care dorește să simplifice sarcinile de generare a PDF-urilor și să producă documente cu aspect profesional cu ușurință.

Previous Next

Noțiuni introductive cu Python-PDFKit

Cea mai recomandată și simplă modalitate de a instala Python-PDFKit este utilizarea pip. Vă rugăm să utilizați următoarea comandă pentru o instalare fără probleme.

Instalați Python-PDFKit  prin pip

 pip install pdfkit 

De asemenea, îl puteți instala manual; descărcați cele mai recente fișiere de lansare direct din depozitul GitHub.

Extrageți text din PDF prin Python

Biblioteca Python-PDFKit oferă capacitatea de extragere programatică a textului din fișierele PDF prin Python. Nu este ușor să recuperați date dintr-un fișier PDF, deoarece modul în care PDF stochează informațiile îngreunează doar obținerea acestora. Python-PDFKit facilitează munca dezvoltatorilor, oferindu-le funcții încorporate ușor de utilizat pentru preluarea informațiilor. Ei pot folosi metoda extractText() pe obiectul pagină pentru a obține conținutul text al paginii.

Extrageți text din PDF prin Python

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

Generarea documentelor PDF prin API-ul Python

Biblioteca open source Python-PDFKit le permite dezvoltatorilor de software să genereze cu ușurință fișiere PDF în aplicațiile lor Python. Biblioteca a oferit suport pentru generarea de PDF-uri din diverse surse. Biblioteca permite dezvoltatorilor de software să creeze PDF-uri din fișiere HTML, șiruri de caractere sau chiar URL-uri. De asemenea, este posibil să adăugați imagini, anteturi și subsoluri, să setați dimensiunea paginii, să setați margini și așa mai departe în aplicațiile Python. Următorul exemplu demonstrează cum dezvoltatorii de software pot genera fișiere PDF din diverse surse cu doar câteva linii de cod Python.

Generează un PDF dintr-un fișier HTML, șir sau URL prin API-ul Python

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

Personalizarea generării PDF în cadrul aplicațiilor Python

Biblioteca open source Python-PDFKit permite dezvoltatorilor de software să personalizeze procesul de generare PDF în cadrul propriilor aplicații. Dezvoltatorii de software pot specifica diverse opțiuni, cum ar fi dimensiunea paginii, marginile, anteturile/subsolurile, îmbinarea mai multor documente PDF și multe altele. Aceste opțiuni sunt transmise la wkhtmltopdf ca argumente de linie de comandă. Următorul exemplu arată modul în care dezvoltatorii de software pot personaliza procesul de generare PDF în cadrul aplicațiilor Python.

Cum să personalizați procesul de generare PDF prin API-ul Python?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

Conversia HTML în PDF prin Biblioteca Python

Biblioteca open source Python-PDFKit este o bibliotecă foarte ușor de utilizat pentru încărcarea și convertirea documentelor HTML în fișiere PDF în aplicațiile lor Python. Pe lângă generarea de PDF-uri, biblioteca poate converti conținutul HTML în PDF direct, fără a salva un fișier intermediar. Acest lucru poate fi util atunci când aveți de-a face cu conținut dinamic sau când generați PDF-uri din mers. Mai jos este un exemplu simplu care arată modul în care programatorii de computere pot converti documente HTML în fișiere PDF în aplicațiile Python.

 

Cum se convertesc documente HTML în fișiere PDF prin Python?

import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 Română