1. Prodotti
  2.   PDF
  3.   Python
  4.   Pikepdf
 
  

Libreria Python open source per elaborare file PDF

L'API Python gratuita consente la linearizzazione dei PDF e l'accesso ai PDF crittografati. Supporta la creazione di PDF da zero, la copia di pagine da un PDF all'altro, la divisione o l'unione di PDF e molti altri.

PikePDF è una libreria PDF Python molto semplice che consente agli sviluppatori di software di lavorare con file PDF all'interno di applicazioni Python. Si basa su QPDF, una potente libreria di manipolazione e riparazione PDF. PikePDF è una libreria di trasformazione del contenuto PDF e fornisce un accesso di basso livello ai file PDF. Ciò significa che gli utenti devono conoscere i componenti interni del PDF e avere familiarità con le specifiche del PDF. La libreria è open source ed è disponibile con licenza MIT per uso pubblico. La libreria è open source ed è disponibile sotto la licenza MPL-2.0.

PikePDF fornisce supporto per la linearizzazione dei PDF e l'accesso ai PDF crittografati. Ha incluso un set molto potente di funzionalità relative alla gestione dei PDF come la creazione di PDF da zero, la copia di pagine da un PDF all'altro, la divisione o l'unione di PDF, l'estrazione di immagini o testo da PDF, la sostituzione del contenuto in PDF, il supporto per la riparazione di PDF, la pagina supporto delle impostazioni, gestione dei metadati PDF, lavoro con protezione da password, modifica dei metadati PDF XMP, trasformazione di PDF esistenti e altro ancora.

.

Previous Next

Iniziare con PikePDF

PikePDF richiede Python 3.6 e versioni successive. Puoi installare PikePDF usando pip. Si prega di utilizzare il seguente comando per installarlo.

Installa PikePDF tramite pip

 pip install pikepdf

Copia le pagine da un PDF all'altro tramite Python

La libreria open source PikePDF offre la capacità che consente agli sviluppatori di software di copiare una pagina da un PDF all'altro con solo un paio di righe di codice Python. La copia di pagine tra oggetti PDF creerà una copia superficiale della pagina di origine all'interno del file PDF di destinazione e pertanto la modifica delle pagine non influirà sui documenti PDF originali. È anche possibile sostituire pagine specifiche con contenuti personalizzati. È anche possibile copiare pagine all'interno di un particolare PDF.

Apri e manipola documenti PDF tramite Python

 # PDF Documents Manipulation 
  from pikepdf import Pdf
  new_pdf = Pdf.new()
  with Pdf.open('sample.pdf') as pdf:
    pdf.save('output.pdf') 
   # Copying pages from other PDFs
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  appendix = Pdf.open('../tests/resources/sandwich.pdf')
  pdf.pages.extend(appendix.pages)

Divisione e unione di PDF tramite Python

La libreria PDF PikePDF offre agli sviluppatori di software la possibilità di accedere ai file PDF esistenti e dividerli in più file PDF con facilità. Durante la divisione del PDF, tutto ciò di cui abbiamo bisogno è che i nuovi PDF contengano le pagine di destinazione. La libreria si assicura anche di trasferire i dati associati a ciascuna pagina, in modo che ogni pagina stia in piedi da sola. La libreria includeva anche il supporto per unire o concatenare più documenti PDF in uno solo. È anche possibile invertire l'ordine delle pagine PDF con solo un paio di righe di codice.

Dividi e unisci documenti PDF tramite Python

 # PDF Splitting
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  for n, page in enumerate(pdf.pages):
  dst = Pdf.new()
  dst.pages.append(page)
  dst.save(f'{n:02d}.pdf')
  # Combine Multiple PDF pages into a single One
  from glob import glob
  pdf = Pdf.new()
  for file in glob('*.pdf'):
  src = Pdf.open(file)
  pdf.pages.extend(src.pages)
  pdf.save('merged.pdf')

Gestisci le immagini all'interno del documento PDF tramite Python

La libreria PDF PikePDF consente agli sviluppatori di software di gestire facilmente le immagini all'interno di un file PDF utilizzando i comandi Python. La libreria ha incluso diverse importanti funzioni relative alla gestione delle immagini come la copia di immagini all'interno di una pagina PDF, l'apertura e la visualizzazione di PDF, il ridimensionamento di immagini, la manipolazione di immagini in un PDF, l'estrazione di immagini da PDF, la sostituzione di immagini, l'eliminazione di un'immagine da PDF e molte altre .

Estrai l'immagine e sostituiscila in PDF tramite Python

 # Extract Image & Replace PDF Images
  import zlib
  rawimage = pdfimage.obj
  pillowimage = pdfimage.as_pil_image()
  greyscale = pillowimage.convert('L')
  greyscale = greyscale.resize((32, 32))
  rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
  rawimage.ColorSpace = Name("/DeviceGray")
  rawimage.Width, rawimage.Height = 32, 32

Gestione dei metadati PDF tramite Python

I metadati PDF includono informazioni molto utili su un documento PDF come il nome dell'autore, la data di creazione e modifica, parole chiave, informazioni sul copyright e così via. La libreria PDF PikePDF ha incluso funzionalità complete per l'accesso e la lettura di metadati, l'estrazione di metadati, l'eliminazione di voci di metadati da documenti PDF. L'esempio di codice seguente mostra come estrarre i metadati dai documenti PDF.

Come estrarre metadati PDF tramite Python

 # Extract PDF Metadata
  import pikepdf
  import sys
  # get the target pdf file from the command-line arguments
  pdf_filename = sys.argv[1]
  # read the pdf file
  pdf = pikepdf.Pdf.open(pdf_filename)
  docinfo = pdf.docinfo
  for key, value in docinfo.items():
    print(key, ":", value)
 Italiano