Leabharlann Python Foinse Oscailte chun Comhaid PDF a Phróiseáil
Ceadaíonn API Python saor in aisce do PDFanna a líneáil agus rochtain a fháil ar PDFanna criptithe. Tacaíonn sé le cruthú PDF ón tús, cóipeáil leathanaigh ó PDF amháin go ceann eile, scoilt nó cumasc PDFanna agus go leor eile.
Is leabharlann Python PDF an-simplí é PikePDF a ligeann d’fhorbróirí bogearraí oibriú le comhaid PDF taobh istigh d’fheidhmchláir Python. Tá sé bunaithe ar QPDF, leabharlann chumhachtach ionramhála agus deisiúcháin PDF. Is leabharlann claochlaithe ábhair PDF é PikePDF agus soláthraíonn sé rochtain íseal-leibhéil ar chomhaid PDF. Ciallaíonn sé seo go bhfuil eolas ag teastáil ó úsáideoirí ar inmheánacha PDF agus eolas ar shonraí PDF. Tá an leabharlann foinse oscailte agus tá sí ar fáil faoin gceadúnas MIT le haghaidh úsáid phoiblí. Tá an leabharlann foinse oscailte agus tá sí ar fáil faoin gCeadúnas MPL-2.0.
Soláthraíonn an PikePDF tacaíocht chun PDFanna a líneáil agus rochtain ar PDFanna criptithe. Áiríodh leis sraith gnéithe an-chumhachtacha a bhaineann le bainistíocht PDF, mar chruthú PDF ón tús, leathanaigh a chóipeáil ó PDF amháin go ceann eile, PDFanna a scoilt nó a chumasc, eastóscadh íomhá nó téacs ó PDF, athsholáthar ábhair i PDF, tacaíocht deisithe PDF, leathanach. tacaítear le socruithe, bainistigh meiteashonraí PDF, oibriú le pasfhocal-chosaint, eagarthóireacht meiteashonraí PDF XMP, claochlú PDF atá ann cheana féin agus fear níos mó.
.
Tús a chur le PikePDF
Éilíonn PikePDF Python 3.6 agus níos airde. Is féidir leat PikePDF a shuiteáil ag baint úsáide as pip. Bain úsáid as an ordú seo a leanas chun é a shuiteáil.
Suiteáil PikePDF trí pip
pip install pikepdf
Cóipeáil Leathanaigh ó PDF amháin go ceann eile trí Python
Soláthraíonn leabharlann foinse oscailte PikePDF an cumas a chuireann ar chumas forbróirí bogearraí leathanach a chóipeáil ó PDF amháin go ceann eile gan ach cúpla líne de chód Python. Cruthóidh cóipeáil leathanaigh idir réada PDF cóip éadomhain den leathanach foinse laistigh den spriocchomhad PDF agus dá bhrí sin ní bheidh tionchar ag modhnú na leathanaigh ar na doiciméid PDF bunaidh. Is féidir freisin leathanaigh shainiúla a athsholáthar le hábhar saincheaptha. Is féidir freisin leathanaigh a chóipeáil laistigh de PDF ar leith.
Oscail agus ionramháil Doiciméid PDF trí Python
# PDF Documents Manipulation
from pikepdf import Pdf
new_pdf = Pdf.new()
with Pdf.open('sample.pdf') as pdf:
pdf.save('output.pdf')
# Copying pages from other PDFs
pdf = Pdf.open('../tests/resources/fourpages.pdf')
appendix = Pdf.open('../tests/resources/sandwich.pdf')
pdf.pages.extend(appendix.pages)
Pdf scoilteadh agus chumasc trí python
Tugann leabharlann PDF PikePDF cumhacht d’fhorbróirí bogearraí rochtain a fháil ar chomhaid PDF atá ann cheana féin agus iad a roinnt ina ilchomhaid PDF gan stró. Agus PDF á scoilteadh níl de dhíth orainn ach go gcaithfidh na PDFanna nua na leathanaigh sprice a choinneáil. Cinntíonn an leabharlann freisin sonraí a bhaineann le gach leathanach a aistriú, ionas go seasann gach leathanach ina aonar. Áiríodh sa leabharlann freisin tacaíocht chun ildhoiciméid PDF a chumasc nó a chomhchaitheamh in aon cheann amháin. Is féidir freisin ord na leathanaigh PDF a aisiompú gan ach cúpla líne de chód.
Scoilt & Cumaisc Doiciméid PDF trí Python
# PDF Splitting
pdf = Pdf.open('../tests/resources/fourpages.pdf')
for n, page in enumerate(pdf.pages):
dst = Pdf.new()
dst.pages.append(page)
dst.save(f'{n:02d}.pdf')
# Combine Multiple PDF pages into a single One
from glob import glob
pdf = Pdf.new()
for file in glob('*.pdf'):
src = Pdf.open(file)
pdf.pages.extend(src.pages)
pdf.save('merged.pdf')
Bainistigh Íomhánna taobh istigh de Dhoiciméad PDF trí Python
Déanann leabharlann PDF PikePDF éascaíocht d’fhorbróirí bogearraí íomhánna a láimhseáil taobh istigh de chomhad PDF ag baint úsáide as orduithe Python. Tá roinnt feidhmeanna tábhachtacha a bhaineann le láimhseáil íomhá curtha san áireamh sa leabharlann mar íomhánna a chóipeáil laistigh de leathanach PDF, PDF a oscailt agus a fheiceáil, íomhánna a athrú, íomhánna a ionramháil i PDF, íomhánna a bhaint as PDF, íomhánna a athsholáthar, íomhá a scriosadh as PDF, agus go leor eile. .
Sliocht Íomhá & Ionadaigh é i PDF trí Python
# Extract Image & Replace PDF Images
import zlib
rawimage = pdfimage.obj
pillowimage = pdfimage.as_pil_image()
greyscale = pillowimage.convert('L')
greyscale = greyscale.resize((32, 32))
rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
rawimage.ColorSpace = Name("/DeviceGray")
rawimage.Width, rawimage.Height = 32, 32
Láimhseáil meiteashonraí PDF trí Python
Áirítear le meiteashonraí PDF faisnéis an-úsáideach faoi dhoiciméad PDF mar ainm an údair, dáta cruthaithe & modhnú, eochairfhocail, faisnéis cóipchirt, agus mar sin de. Tá feidhmiúlacht iomlán i leabharlann PDF PikePDF chun meiteashonraí a rochtain agus a léamh, meiteashonraí a bhaint amach, iontrálacha meiteashonraí a scriosadh ó dhoiciméid PDF. Léiríonn an sampla cód seo a leanas conas meiteashonraí a bhaint as doiciméid PDF.
Conas Meiteashonraí PDF a Bhaint trí Python
# Extract PDF Metadata
import pikepdf
import sys
# get the target pdf file from the command-line arguments
pdf_filename = sys.argv[1]
# read the pdf file
pdf = pikepdf.Pdf.open(pdf_filename)
docinfo = pdf.docinfo
for key, value in docinfo.items():
print(key, ":", value)