1. Prodotti
  2.   PDF
  3.   Python
  4.   Python-PDFKit
 
  

Genera e gestisci documenti PDF tramite API Python gratuita

Libreria Python open source per creare e personalizzare file PDF, unire più PDF ed estrarre testo da PDF. Utilizza Wkhtmltopdf Python Wrapper per convertire HTML in PDF.

Python è da tempo il linguaggio preferito dagli sviluppatori di software e dai data scientist grazie alla sua semplicità e versatilità. Uno dei tanti vantaggi di Python è il suo ricco ecosistema di librerie che coprono vari domini. Una di queste librerie è Python-PDFKit, un potente strumento per la manipolazione dei PDF in Python. Che tu abbia bisogno di generare PDF, estrarre informazioni da quelli esistenti o persino convertire contenuti HTML in PDF, Python-PDFKit ti copre. La libreria è molto facile da gestire e consente agli utenti di generare PDF da HTML, URL o stringhe HTML non elaborate senza problemi.

Python-PDFKit è un wrapper Python per il popolare strumento di conversione PDF, wkhtmltopdf, scritto in C++. Con questa libreria, gli sviluppatori possono integrare facilmente la generazione e la manipolazione di PDF nelle loro applicazioni Python. Ci sono diverse funzionalità importanti che fanno parte della libreria per la gestione dei documenti PDF tramite la creazione di PDF da file HTML, la creazione di PDF da URL, la personalizzazione del processo di generazione di PDF, la conversione diretta del contenuto HTML in PDF, l'unione di più documenti PDF in un unico file, la gestione dei file PDF /footers, impostazione della dimensione della pagina PDF e molto altro.

La libreria Python-PDFKit fornisce un'interfaccia intuitiva e diretta per interagire con lo strumento da riga di comando sottostante wkhtmltopdf, consentendo agli sviluppatori di software di creare, unire e convertire documenti PDF senza sforzo. Le sue numerose opzioni di configurazione consentono di ottimizzare l'output PDF in base ai requisiti specifici. Con il suo semplice processo di installazione e il suo utilizzo intuitivo, Python-PDFKit è una preziosa aggiunta al toolkit di qualsiasi sviluppatore. In conclusione, Python-PDFKit è una libreria assolutamente da provare per qualsiasi sviluppatore Python che desideri semplificare le attività di generazione di PDF e produrre facilmente documenti dall'aspetto professionale.

Previous Next

Iniziare con Python-PDFKit

Il modo più semplice e consigliato per installare Python-PDFKit è utilizzare pip. Si prega di utilizzare il seguente comando per un'installazione fluida.

Installa Python-PDFKit tramite pip

 pip install pdfkit 

Puoi anche installarlo manualmente; scarica i file della versione più recente direttamente dal repository GitHub.

Estrai testo da PDF tramite Python

La libreria Python-PDFKit fornisce funzionalità per estrarre a livello di codice testo da file PDF tramite Python. Non è facile recuperare i dati da un file PDF perché il modo in cui il PDF memorizza le informazioni rende difficile riuscirci. Python-PDFKit semplifica il lavoro degli sviluppatori fornendo loro funzioni integrate facili da usare per il recupero delle informazioni. Possono utilizzare il metodo extractText() sull'oggetto pagina per ottenere il contenuto testuale della pagina.

Estrai testo da PDF tramite Python

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

Generazione di documenti PDF tramite API Python

La libreria open source Python-PDFKit consente agli sviluppatori di software di generare facilmente file PDF all'interno delle loro applicazioni Python. La libreria ha fornito supporto per la generazione di PDF da varie fonti. La libreria consente agli sviluppatori di software di creare PDF da file HTML, stringhe o persino URL. È anche possibile aggiungere immagini, intestazioni e piè di pagina, impostare le dimensioni della pagina, impostare i margini e così via all'interno delle applicazioni Python. L'esempio seguente dimostra come gli sviluppatori di software possono generare file PDF da varie fonti con solo un paio di righe di codice Python.

Genera un PDF da un file HTML, una stringa o un URL tramite API Python

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

Personalizzare la generazione di PDF all'interno delle app Python

La libreria open source Python-PDFKit consente agli sviluppatori di software di personalizzare il processo di generazione di PDF all'interno delle proprie applicazioni. Gli sviluppatori di software possono specificare varie opzioni come dimensioni della pagina, margini, intestazioni/piè di pagina, unione di più documenti PDF e altro ancora. Queste opzioni vengono passate a wkhtmltopdf come argomenti della riga di comando. L'esempio seguente mostra come gli sviluppatori di software possono personalizzare il processo di generazione di PDF all'interno delle applicazioni Python.

Come personalizzare il processo di generazione di PDF tramite API Python?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

Converti HTML in PDF tramite la libreria Python

La libreria open source Python-PDFKit è una libreria molto facile da usare per caricare e convertire documenti HTML in file PDF all'interno delle loro applicazioni Python. Oltre a generare PDF, la libreria può convertire direttamente il contenuto HTML in PDF senza salvare un file intermedio. Ciò può essere utile quando si ha a che fare con contenuti dinamici o si generano PDF al volo. Di seguito è riportato un semplice esempio che mostra come i programmatori di computer possono convertire documenti HTML in file PDF all'interno di applicazioni Python.

 

Come convertire documenti HTML in file PDF tramite Python?

import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 Italiano