Avoimen lähdekoodin Python-kirjasto PDF-tiedostojen käsittelyä varten
Ilmainen Python API mahdollistaa PDF-tiedostojen linearisoinnin ja salattujen PDF-tiedostojen käytön. Se tukee PDF-tiedostojen luomista alusta alkaen, sivujen kopioimista PDF-tiedostosta toiseen, PDF-tiedostojen jakamista tai yhdistämistä ja paljon muuta.
PikePDF on hyvin yksinkertainen Python PDF -kirjasto, jonka avulla ohjelmistokehittäjät voivat käsitellä PDF-tiedostoja Python-sovelluksissa. Se perustuu QPDF:ään, joka on tehokas PDF-käsittely- ja korjauskirjasto. PikePDF on PDF-sisällön muunnoskirjasto, joka tarjoaa matalan tason pääsyn PDF-tiedostoihin. Tämä tarkoittaa, että käyttäjät tarvitsevat tietoa PDF:n sisäisistä ominaisuuksista ja tuntemusta PDF-spesifikaatioista. Kirjasto on avoimen lähdekoodin ja se on saatavilla MIT-lisenssillä julkiseen käyttöön. Kirjasto on avoimen lähdekoodin, ja se on saatavilla MPL-2.0-lisenssillä.
PikePDF tukee PDF-tiedostojen linearisointia ja pääsyä salattuihin PDF-tiedostoihin. Se on sisältänyt erittäin tehokkaan joukon PDF-hallintaan liittyviä ominaisuuksia, kuten PDF:n luominen alusta alkaen, sivujen kopioiminen yhdestä PDF-tiedostosta toiseen, PDF-tiedostojen jakaminen tai yhdistäminen, kuvan tai tekstin poimiminen PDF-tiedostosta, sisällön korvaaminen PDF-muodossa, PDF-korjaustuki, sivu asetusten tuki, PDF-metatietojen hallinta, salasanasuojattu, PDF XMP -metatietojen muokkaus, olemassa olevien PDF-tiedostojen muuntaminen ja paljon muuta.
.
PikePDF:n käytön aloittaminen
PikePDF vaatii Python 3.6:n tai uudemman. Voit asentaa PikePDF:n pip:n avulla. Käytä seuraavaa komentoa asentaaksesi se.
Asenna PikePDF pipin kautta
pip install pikepdf
Kopioi sivuja yhdestä PDF-tiedostosta toiseen Pythonin kautta
Avoimen lähdekoodin PikePDF-kirjasto tarjoaa mahdollisuuden, jonka avulla ohjelmistokehittäjät voivat kopioida sivun PDF-tiedostosta toiseen vain muutamalla Python-koodirivillä. Sivujen kopioiminen PDF-objektien välillä luo matalan kopion lähdesivusta kohde-PDF-tiedostoon, joten sivujen muokkaaminen ei vaikuta alkuperäisiin PDF-dokumentteihin. On myös mahdollista korvata tietyt sivut mukautetulla sisällöllä. On myös mahdollista kopioida tietyn PDF-tiedoston sivuja.
Avaa ja käsittele PDF-dokumentteja Pythonin kautta
# PDF Documents Manipulation
from pikepdf import Pdf
new_pdf = Pdf.new()
with Pdf.open('sample.pdf') as pdf:
pdf.save('output.pdf')
# Copying pages from other PDFs
pdf = Pdf.open('../tests/resources/fourpages.pdf')
appendix = Pdf.open('../tests/resources/sandwich.pdf')
pdf.pages.extend(appendix.pages)
PDF:n jakaminen ja yhdistäminen Pythonin kautta
PDF PikePDF -kirjasto antaa ohjelmistokehittäjille mahdollisuuden käyttää olemassa olevia PDF-tiedostoja ja jakaa ne useiksi PDF-tiedostoiksi helposti. PDF-tiedostoa jaettaessa vaadimme vain, että uusissa PDF-tiedostoissa on oltava kohdesivut. Kirjasto huolehtii myös kullekin sivulle liittyvän tiedon siirtämisestä, jotta jokainen sivu pysyy itsenäisenä. Kirjasto sisälsi myös tuen useiden PDF-dokumenttien yhdistämiseen tai ketjuttamiseen yhdeksi. On myös mahdollista kääntää PDF-sivujen järjestys vain parilla koodirivillä.
Jaa ja yhdistä PDF-dokumentit Pythonin kautta
# PDF Splitting
pdf = Pdf.open('../tests/resources/fourpages.pdf')
for n, page in enumerate(pdf.pages):
dst = Pdf.new()
dst.pages.append(page)
dst.save(f'{n:02d}.pdf')
# Combine Multiple PDF pages into a single One
from glob import glob
pdf = Pdf.new()
for file in glob('*.pdf'):
src = Pdf.open(file)
pdf.pages.extend(src.pages)
pdf.save('merged.pdf')
Hallitse kuvia PDF-dokumentin sisällä Pythonin kautta
PDF PikePDF-kirjaston avulla ohjelmistokehittäjät voivat helposti käsitellä PDF-tiedoston sisällä olevia kuvia Python-komennoilla. Kirjastossa on useita tärkeitä kuvankäsittelyyn liittyviä toimintoja, kuten kuvien kopiointi PDF-sivulla, PDF-tiedoston avaaminen ja katselu, kuvien koon muuttaminen, kuvien käsittely PDF-tiedostosta, kuvien poimiminen PDF-tiedostosta, kuvien korvaaminen, kuvan poistaminen PDF-tiedostosta ja paljon muuta. .
Pura kuva ja korvaa se PDF-muodossa Pythonin kautta
# Extract Image & Replace PDF Images
import zlib
rawimage = pdfimage.obj
pillowimage = pdfimage.as_pil_image()
greyscale = pillowimage.convert('L')
greyscale = greyscale.resize((32, 32))
rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
rawimage.ColorSpace = Name("/DeviceGray")
rawimage.Width, rawimage.Height = 32, 32
PDF-metatietojen käsittely Pythonin kautta
PDF-metatiedot sisältävät erittäin hyödyllistä tietoa PDF-dokumentista, kuten tekijän nimen, luonti- ja muokkauspäivämäärän, avainsanat, tekijänoikeustiedot ja niin edelleen. PDF PikePDF -kirjasto sisältää täydelliset toiminnot metatietojen käyttämiseen ja lukemiseen, metatietojen poimimiseen ja metatietomerkintöjen poistamiseen PDF-dokumenteista. Seuraava koodiesimerkki näyttää, kuinka metatiedot puretaan PDF-dokumenteista.
PDF-metatietojen purkaminen Pythonin kautta
# Extract PDF Metadata
import pikepdf
import sys
# get the target pdf file from the command-line arguments
pdf_filename = sys.argv[1]
# read the pdf file
pdf = pikepdf.Pdf.open(pdf_filename)
docinfo = pdf.docinfo
for key, value in docinfo.items():
print(key, ":", value)