1. Produkter
  2.   PDF
  3.   Python
  4.   Pikepdf
 
  

Open Source Python-bibliotek til at behandle PDF-filer

Gratis Python API tillader linearisering af PDF'er og adgang til krypterede PDF'er. Det understøtter PDF-oprettelse fra bunden, kopiering af sider fra én PDF-fil til en anden, opdeling eller fletning af PDF-filer og mange flere.

PikePDF er et meget simpelt Python PDF-bibliotek, der giver softwareudviklere mulighed for at arbejde med PDF-filer inde i Python-applikationer. Det er baseret på QPDF, et kraftfuldt PDF-manipulations- og reparationsbibliotek. PikePDF er et PDF-indholdstransformationsbibliotek og giver adgang på lavt niveau til PDF-filer. Det betyder, at brugerne har brug for viden om PDF-internets og kendskab til PDF-specifikationer. Biblioteket er open source og er tilgængeligt under MIT-licensen til offentlig brug. Biblioteket er open source og er tilgængeligt under MPL-2.0-licensen.

PikePDF giver support til linearisering af PDF'er og adgang til krypterede PDF'er. Det har inkluderet et meget kraftfuldt sæt funktioner relateret til PDF-administration, såsom PDF-oprettelse fra bunden, kopiering af sider fra én PDF til en anden, opdeling eller fletning af PDF-filer, billed- eller tekstudtrækning fra PDF, erstatning af indhold i PDF, PDF-reparationssupport, side understøttelse af indstillinger, administrer PDF-metadata, arbejde med adgangskodebeskyttet, PDF XMP-metadataredigering, transformation af eksisterende PDF-filer og mere.

.

Previous Next

Kom godt i gang med PikePDF

PikePDF kræver Python 3.6 og nyere. Du kan installere PikePDF ved hjælp af pip. Brug venligst følgende kommando til at installere det.

Installer PikePDF via pip

 pip install pikepdf

Kopier sider fra én PDF til anden via Python

Open source PikePDF-biblioteket giver mulighed for, at softwareudviklere kan kopiere side fra én PDF-fil til en anden med blot et par linjer Python-kode. Kopiering af sider mellem PDF-objekter vil skabe en overfladisk kopi af kildesiden i PDF-målfilen, og ændring af siderne vil derfor ikke påvirke de originale PDF-dokumenter. Det er også muligt at erstatte specifikke sider med tilpasset indhold. Det er også muligt at kopiere sider i en bestemt PDF.

Åbn og manipuler PDF-dokumenter via Python

 # PDF Documents Manipulation 
  from pikepdf import Pdf
  new_pdf = Pdf.new()
  with Pdf.open('sample.pdf') as pdf:
    pdf.save('output.pdf') 
   # Copying pages from other PDFs
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  appendix = Pdf.open('../tests/resources/sandwich.pdf')
  pdf.pages.extend(appendix.pages)

PDF-opdeling og fletning via Python

PDF PikePDF-biblioteket giver softwareudviklere mulighed for nemt at få adgang til eksisterende PDF-filer og opdele dem i flere PDF-filer. Mens vi opdeler PDF, kræver det blot, at de nye PDF'er skal indeholde destinationssiderne. Biblioteket sørger også for at overføre data tilknyttet hver side, så hver side står for sig selv. Biblioteket inkluderede også støtte til at flette eller sammenkæde flere PDF-dokumenter til et enkelt. Det er også muligt at vende rækkefølgen af PDF-siderne med blot et par linjer kode.

Opdel og flet PDF-dokumenter via Python

 # PDF Splitting
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  for n, page in enumerate(pdf.pages):
  dst = Pdf.new()
  dst.pages.append(page)
  dst.save(f'{n:02d}.pdf')
  # Combine Multiple PDF pages into a single One
  from glob import glob
  pdf = Pdf.new()
  for file in glob('*.pdf'):
  src = Pdf.open(file)
  pdf.pages.extend(src.pages)
  pdf.save('merged.pdf')

Administrer billeder i PDF-dokument via Python

PDF PikePDF-biblioteket gør det nemt for softwareudviklere at håndtere billeder inde i en PDF-fil ved hjælp af Python-kommandoer. Biblioteket har inkluderet flere vigtige funktioner relateret til billedhåndtering, såsom kopiering af billeder på PDF-side, åbne og se PDF, ændre størrelse på billeder, manipulere billeder i en PDF, udtrække billeder fra PDF, udskifte billeder, slette et billede fra PDF og mange flere .

Udpak billede og erstat det i PDF via Python

 # Extract Image & Replace PDF Images
  import zlib
  rawimage = pdfimage.obj
  pillowimage = pdfimage.as_pil_image()
  greyscale = pillowimage.convert('L')
  greyscale = greyscale.resize((32, 32))
  rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
  rawimage.ColorSpace = Name("/DeviceGray")
  rawimage.Width, rawimage.Height = 32, 32

PDF-metadatahåndtering via Python

PDF-metadata indeholder meget nyttige oplysninger om et PDF-dokument, såsom forfatterens navn, dato for oprettelse og ændring, nøgleord, copyright-oplysninger og så videre. PDF PikePDF-biblioteket har inkluderet komplet funktionalitet til at få adgang til og læse metadata, udtrække metadata, slette metadataposter fra PDF-dokumenter. Følgende kodeeksempel viser, hvordan man udtrækker metadata fra PDF-dokumenter.

Sådan udpakkes PDF-metadata via Python

 # Extract PDF Metadata
  import pikepdf
  import sys
  # get the target pdf file from the command-line arguments
  pdf_filename = sys.argv[1]
  # read the pdf file
  pdf = pikepdf.Pdf.open(pdf_filename)
  docinfo = pdf.docinfo
  for key, value in docinfo.items():
    print(key, ":", value)
 Dansk