1. Prodotti
  2.   PDF
  3.   Python
  4.   Pdfrw
 
  

Libreria Python open source per la conversione di file PDF

L'API Python gratuita consente agli sviluppatori di esportare, ruotare, unire e concatenare file PDF, estrarre dati ed elementi dai PDF.

pdfrw è una libreria Python pura open source che consente agli sviluppatori di software di leggere e scrivere file PDF senza installare alcun software speciale esterno. La libreria di programmazione pdfrw è molto semplice da usare e il codice sorgente è ben documentato, molto semplice e di facile comprensione. La libreria include il corretto supporto Unicode per le stringhe di testo nei PDF e il più veloce parser Python puro.

La libreria pdfrw include il supporto per diverse importanti operazioni PDF come l'unione di PDF, la modifica dei metadati, la concatenazione di più PDF insieme, l'estrazione di immagini, la stampa di PDF, la rotazione di pagine PDF, la creazione di un nuovo PDF, l'aggiunta di un'immagine PDF con filigrana e molti altri.

.

Previous Next

Per iniziare con pdfrw

pdfrw richiede Python 2.6, 2.7, 3.3, 3.4, 3.5 e 3.6. Puoi installare pdfrw usando pip. Si prega di utilizzare il seguente comando per installarlo.

Installa pdfrw tramite pip

 python -m pip install pdfrw  

Crea documenti PDF tramite la libreria Python

La libreria pdfrw offre agli sviluppatori di software la possibilità di creare documenti PDF all'interno delle proprie applicazioni Python con solo un paio di righe di codice. La libreria fornisce anche supporto per l'accesso e la modifica di file PDF esistenti. Puoi inserire facilmente nuove pagine, nonché componenti grafici o elementi di testo nel PDF esistente. La libreria pdfrw fornisce supporto per trovare le pagine nei file PDF che hai letto e per riscrivere una serie di pagine in un nuovo file PDF.

Crea e modifica documenti PDF tramite Python

 // PDF Documents Creation 
  import sys
  import os
  from pdfrw import PdfReader, PdfWriter
  inpfn, = sys.argv[1:]
  outfn = 'alter.' + os.path.basename(inpfn)
  trailer = PdfReader(inpfn)
  trailer.Info.Title = 'My New Title Goes Here'
  PdfWriter(outfn, trailer=trailer).write() 

Lettura di file PDF tramite Python

La libreria pdfrw consente agli sviluppatori di software di accedere e leggere facilmente diverse parti di documenti PDF all'interno delle applicazioni Python. Offre un facile accesso all'intero documento PDF. La libreria supporta il recupero di informazioni sui file, dimensioni e altro. Crea un attributo speciale denominato pagine, che consente agli utenti di elencare tutte le pagine di un documento PDF. Ti consente di estrarre un oggetto di informazioni sul documento che puoi utilizzare per estrarre informazioni come autore, titolo, ecc.

Accedi e leggi i file PDF tramite Python

 // Reading PDF Files
  from pdfrw import pdfreader
  def get_pdf_info(path):
    pdf = pdfreader(path)
    print(pdf.keys())
    print(pdf.info)
    print(pdf.root.keys())
    print('pdf has {} pages'.format(len(pdf.pages)))
  if __name__ == '__main__':
    get_pdf_info('w9.pdf')

Aggiunta o modifica di metadati

pdfrw consente agli sviluppatori di software di aggiungere o modificare i metadati dei file PDF all'interno delle proprie applicazioni Python. È possibile modificare un singolo elemento di metadati in un PDF, scrivere il risultato in un nuovo PDF e includere più file e concatenarli dopo aver aggiunto alcuni metadati senza senso al file PDF di output.

Modifica i metadati PDF tramite Python

 // Modifying PDF Metadata
  import sys
  import os
  from pdfrw import PdfReader, PdfWriter
  inpfn, = sys.argv[1:]
  outfn = 'alter.' + os.path.basename(inpfn)
  trailer = PdfReader(inpfn)
  trailer.Info.Title = 'My New Title Goes Here'
  PdfWriter(outfn, trailer=trailer).write() 

Divisione di documenti PDF

pdfrw consente agli sviluppatori di software di dividere in modo programmatico i documenti PDF all'interno delle loro applicazioni. Un utente potrebbe richiedere l'estrazione di una parte specifica di un libro PDF o la sua divisione in più PDF invece di archiviarli in un unico file. È molto semplice con la libreria pdfrw, devi solo fornire un percorso del file PDF di input, il numero di pagine che desideri estrarre e il percorso di output.

Dividi file PDF in più PDF tramite Python

 // Splitting PDF file into multiple pdfs
  from pdfrw import pdfreader, pdfwriter
  def split(path, number_of_pages, output):
    pdf_obj = pdfreader(path)
    total_pages = len(pdf_obj.pages)
    writer = pdfwriter()
    for page in range(number_of_pages):
      if page <= total_pages:
        writer.addpage(pdf_obj.pages[page])
    writer.write(output)
  if __name__ == '__main__':
    split('reportlab-sample.pdf', 10, 'subset.pdf')
 Italiano