Avoimen lähdekoodin Python-kirjasto PDF-tiedostojen käsittelyä varten

Ilmainen Python API mahdollistaa PDF-tiedostojen linearisoinnin ja salattujen PDF-tiedostojen käytön. Se tukee PDF-tiedostojen luomista alusta alkaen, sivujen kopioimista PDF-tiedostosta toiseen, PDF-tiedostojen jakamista tai yhdistämistä ja paljon muuta.

PikePDF on hyvin yksinkertainen Python PDF -kirjasto, jonka avulla ohjelmistokehittäjät voivat käsitellä PDF-tiedostoja Python-sovelluksissa. Se perustuu QPDF:ään, joka on tehokas PDF-käsittely- ja korjauskirjasto. PikePDF on PDF-sisällön muunnoskirjasto, joka tarjoaa matalan tason pääsyn PDF-tiedostoihin. Tämä tarkoittaa, että käyttäjät tarvitsevat tietoa PDF:n sisäisistä ominaisuuksista ja tuntemusta PDF-spesifikaatioista. Kirjasto on avoimen lähdekoodin ja se on saatavilla MIT-lisenssillä julkiseen käyttöön. Kirjasto on avoimen lähdekoodin, ja se on saatavilla MPL-2.0-lisenssillä.

PikePDF tukee PDF-tiedostojen linearisointia ja pääsyä salattuihin PDF-tiedostoihin. Se on sisältänyt erittäin tehokkaan joukon PDF-hallintaan liittyviä ominaisuuksia, kuten PDF:n luominen alusta alkaen, sivujen kopioiminen yhdestä PDF-tiedostosta toiseen, PDF-tiedostojen jakaminen tai yhdistäminen, kuvan tai tekstin poimiminen PDF-tiedostosta, sisällön korvaaminen PDF-muodossa, PDF-korjaustuki, sivu asetusten tuki, PDF-metatietojen hallinta, salasanasuojattu, PDF XMP -metatietojen muokkaus, olemassa olevien PDF-tiedostojen muuntaminen ja paljon muuta.

Yhdellä silmäyksellä

Yleiskatsaus PikePDF:n ominaisuuksiin.

Ominaisuuksien yleiskatsaus

Luo PDF
Kopioi PDF-sivut
Pura kuvat
PDF korjaus
Pura tekstiä
Jaa PDF-tiedostoja
Yhdistä PDF-tiedostoja
Kääntyvät PDF-tiedostot
PDF-tiedostojen ketjuttaminen
Hyperlinkkien upottaminen
Lisää ympyröitä
Lisää monimutkaisia muotoja
Sisällön vaihtaminen
Tietojen poiminta
Tekstin välitys
PDF-lomake
Kuvien upottaminen

PikePDF

PikePDF tukee PDF-tiedostomuotoa sekä alan standardimuotoja vientiä varten.

Lukija

Kirjailija

TXT, HTML

PikePDF

Alustan riippumattomuus

PikePDF on testattu Python 3.6:lla tai uudemmalla.

Python 3.6 ja uudemmat

PikePDF

PikePDF:n käytön aloittaminen

PikePDF vaatii Python 3.6:n tai uudemman. Voit asentaa PikePDF:n pip:n avulla. Käytä seuraavaa komentoa asentaaksesi se.

Asenna PikePDF pipin kautta

 pip install pikepdf

Kopioi sivuja yhdestä PDF-tiedostosta toiseen Pythonin kautta

Avoimen lähdekoodin PikePDF-kirjasto tarjoaa mahdollisuuden, jonka avulla ohjelmistokehittäjät voivat kopioida sivun PDF-tiedostosta toiseen vain muutamalla Python-koodirivillä. Sivujen kopioiminen PDF-objektien välillä luo matalan kopion lähdesivusta kohde-PDF-tiedostoon, joten sivujen muokkaaminen ei vaikuta alkuperäisiin PDF-dokumentteihin. On myös mahdollista korvata tietyt sivut mukautetulla sisällöllä. On myös mahdollista kopioida tietyn PDF-tiedoston sivuja.

Avaa ja käsittele PDF-dokumentteja Pythonin kautta

 # PDF Documents Manipulation 
  from pikepdf import Pdf
  new_pdf = Pdf.new()
  with Pdf.open('sample.pdf') as pdf:
    pdf.save('output.pdf') 
   # Copying pages from other PDFs
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  appendix = Pdf.open('../tests/resources/sandwich.pdf')
  pdf.pages.extend(appendix.pages)

PDF:n jakaminen ja yhdistäminen Pythonin kautta

PDF PikePDF -kirjasto antaa ohjelmistokehittäjille mahdollisuuden käyttää olemassa olevia PDF-tiedostoja ja jakaa ne useiksi PDF-tiedostoiksi helposti. PDF-tiedostoa jaettaessa vaadimme vain, että uusissa PDF-tiedostoissa on oltava kohdesivut. Kirjasto huolehtii myös kullekin sivulle liittyvän tiedon siirtämisestä, jotta jokainen sivu pysyy itsenäisenä. Kirjasto sisälsi myös tuen useiden PDF-dokumenttien yhdistämiseen tai ketjuttamiseen yhdeksi. On myös mahdollista kääntää PDF-sivujen järjestys vain parilla koodirivillä.

Jaa ja yhdistä PDF-dokumentit Pythonin kautta

 # PDF Splitting
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  for n, page in enumerate(pdf.pages):
  dst = Pdf.new()
  dst.pages.append(page)
  dst.save(f'{n:02d}.pdf')
  # Combine Multiple PDF pages into a single One
  from glob import glob
  pdf = Pdf.new()
  for file in glob('*.pdf'):
  src = Pdf.open(file)
  pdf.pages.extend(src.pages)
  pdf.save('merged.pdf')

Hallitse kuvia PDF-dokumentin sisällä Pythonin kautta

PDF PikePDF-kirjaston avulla ohjelmistokehittäjät voivat helposti käsitellä PDF-tiedoston sisällä olevia kuvia Python-komennoilla. Kirjastossa on useita tärkeitä kuvankäsittelyyn liittyviä toimintoja, kuten kuvien kopiointi PDF-sivulla, PDF-tiedoston avaaminen ja katselu, kuvien koon muuttaminen, kuvien käsittely PDF-tiedostosta, kuvien poimiminen PDF-tiedostosta, kuvien korvaaminen, kuvan poistaminen PDF-tiedostosta ja paljon muuta. .

Pura kuva ja korvaa se PDF-muodossa Pythonin kautta

 # Extract Image & Replace PDF Images
  import zlib
  rawimage = pdfimage.obj
  pillowimage = pdfimage.as_pil_image()
  greyscale = pillowimage.convert('L')
  greyscale = greyscale.resize((32, 32))
  rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
  rawimage.ColorSpace = Name("/DeviceGray")
  rawimage.Width, rawimage.Height = 32, 32

PDF-metatietojen käsittely Pythonin kautta

PDF-metatiedot sisältävät erittäin hyödyllistä tietoa PDF-dokumentista, kuten tekijän nimen, luonti- ja muokkauspäivämäärän, avainsanat, tekijänoikeustiedot ja niin edelleen. PDF PikePDF -kirjasto sisältää täydelliset toiminnot metatietojen käyttämiseen ja lukemiseen, metatietojen poimimiseen ja metatietomerkintöjen poistamiseen PDF-dokumenteista. Seuraava koodiesimerkki näyttää, kuinka metatiedot puretaan PDF-dokumenteista.

PDF-metatietojen purkaminen Pythonin kautta

 # Extract PDF Metadata
  import pikepdf
  import sys
  # get the target pdf file from the command-line arguments
  pdf_filename = sys.argv[1]
  # read the pdf file
  pdf = pikepdf.Pdf.open(pdf_filename)
  docinfo = pdf.docinfo
  for key, value in docinfo.items():
    print(key, ":", value)