Open Source Python-bibliotek til konvertering af PDF-filer

Gratis Python API giver udviklere mulighed for at eksportere, rotere, flette og sammenkæde PDF-filer, udtrække data og elementer fra PDF-filer.

pdfrw er et open source rent Python-bibliotek, der giver softwareudviklere mulighed for at læse og skrive PDF-filer uden at installere nogen ekstern specialsoftware. pdfrw-programmeringsbiblioteket er meget enkelt at bruge, og kildekoden er veldokumenteret, meget enkel og let at forstå. Biblioteket har inkluderet ordentlig Unicode-understøttelse af tekststrenge i PDF'er samt den hurtigste rene Python PDF-parser.

pdfrw-biblioteket inkluderer understøttelse af flere vigtige PDF-handlinger, såsom fletning af PDF-filer, ændring af metadata, sammenkædning af flere PDF-filer, udtrækning af billeder, PDF-udskrivning, Rotering af PDF-sider, Oprettelse af en ny PDF, Tilføjelse af et vandmærke PDF-billede og mange flere.

Ved første øjekast

En oversigt over pdfrw funktioner.

Oversigt over funktioner

Opret PDF
Rediger PDF
Opdeling af PDF-filer
Sammenlægning af PDF-filer
Roterende PDFS
Sammenkædning af PDF'er
Indlejring af hyperlinks
Indsæt cirkler
Tilføj komplekse former
Unicode-understøttelse
Dataudtræk
Tekstkerner
Indlejring af skrifttyper
Krypter PDF
PDF-formular
Indlejring af billeder

pdfrw

pdfrw understøtter PDF-filformat såvel som industristandardformater til eksport.

Læser

Forfatter

TXT, HTML

pdfrw

Platformuafhængighed

pdfrw er testet med Python 2.6, 2.7, 3.3, 3.4, 3.5 og 3.6.

Python 2.6 og nyere

pdfrw

Kom godt i gang med pdfrw

pdfrw kræver Python 2.6, 2.7, 3.3, 3.4, 3.5 og 3.6. Du kan installere pdfrw ved hjælp af pip. Brug venligst følgende kommando til at installere det.

Installer pdfrw via pip

 python -m pip install pdfrw

Opret PDF-dokumenter via Python Library

pdfrw-biblioteket giver softwareudviklere muligheden for at oprette Opret PDF-dokumenter i deres egne Python-applikationer med blot et par linjer kode. Biblioteket giver også støtte til at få adgang til og ændre eksisterende PDF-filer. Du kan nemt indsætte nye sider samt grafikkomponenter eller tekstelementer i den eksisterende PDF. pdfrw-biblioteket giver support til at finde siderne i PDF-filer, du læser i, og til at skrive et sæt sider tilbage til en ny PDF-fil.

Opret og rediger PDF-dokumenter via Python

 // PDF Documents Creation 
  import sys
  import os
  from pdfrw import PdfReader, PdfWriter
  inpfn, = sys.argv[1:]
  outfn = 'alter.' + os.path.basename(inpfn)
  trailer = PdfReader(inpfn)
  trailer.Info.Title = 'My New Title Goes Here'
  PdfWriter(outfn, trailer=trailer).write()

Læsning af PDF-filer via Python

pdfrw-biblioteket giver softwareudviklere mulighed for nemt at få adgang til og læse forskellige dele af PDF-dokumenter i Python-applikationer. Det giver nem adgang til hele PDF-dokumentet. Biblioteket understøtter hentning af filoplysninger, størrelse og mere. Det opretter en særlig egenskab ved navn sider, som giver brugerne mulighed for at liste alle siderne i et PDF-dokument. Det lader dig udtrække et dokumentinformationsobjekt, som du kan bruge til at trække oplysninger ud som forfatter, titel osv.

Få adgang til og læs PDF-filer via Python

 // Reading PDF Files
  from pdfrw import pdfreader
  def get_pdf_info(path):
    pdf = pdfreader(path)
    print(pdf.keys())
    print(pdf.info)
    print(pdf.root.keys())
    print('pdf has {} pages'.format(len(pdf.pages)))
  if __name__ == '__main__':
    get_pdf_info('w9.pdf')

Tilføjelse eller ændring af metadata

pdfrw giver softwareudviklere mulighed for at tilføje eller ændre metadata af PDF-filer i deres egne Python-applikationer. Du kan ændre et enkelt metadata-element i en PDF, skrive resultatet til en ny PDF samt lade flere filer inkludere og sammenkæde dem efter at have tilføjet nogle useriøse metadata til output-PDF-filen.

Rediger PDF-metadata via Python

 // Modifying PDF Metadata
  import sys
  import os
  from pdfrw import PdfReader, PdfWriter
  inpfn, = sys.argv[1:]
  outfn = 'alter.' + os.path.basename(inpfn)
  trailer = PdfReader(inpfn)
  trailer.Info.Title = 'My New Title Goes Here'
  PdfWriter(outfn, trailer=trailer).write()

Opdeling af PDF-dokumenter

pdfrw giver softwareudviklere mulighed for programmæssigt at opdele PDF-dokumenter i deres applikationer. En bruger kan kræve at udtrække en bestemt del af en PDF-bog eller opdele den i flere PDF-filer i stedet for at gemme dem i én fil. Det er meget nemt med pdfrw-biblioteket, du skal bare angive en input-PDF-filsti, antallet af sider, du vil udpakke, og outputstien.

Opdel PDF-fil til flere PDF-filer via Python

 // Splitting PDF file into multiple pdfs
  from pdfrw import pdfreader, pdfwriter
  def split(path, number_of_pages, output):
    pdf_obj = pdfreader(path)
    total_pages = len(pdf_obj.pages)
    writer = pdfwriter()
    for page in range(number_of_pages):
      if page <= total_pages:
        writer.addpage(pdf_obj.pages[page])
    writer.write(output)
  if __name__ == '__main__':
    split('reportlab-sample.pdf', 10, 'subset.pdf')