PDF fayllarını emal etmək üçün açıq mənbəli Python kitabxanası
Pulsuz Python API PDF-ləri xəttiləşdirməyə və şifrələnmiş PDF-lərə daxil olmağa imkan verir. O, sıfırdan PDF yaratmağı, səhifələri bir PDF-dən digərinə köçürməyi, PDF-ləri bölmək və ya birləşdirməyi və daha çoxunu dəstəkləyir.
PikePDF, proqram tərtibatçılarına Python proqramları daxilində PDF faylları ilə işləməyə imkan verən çox sadə Python PDF kitabxanasıdır. O, güclü PDF manipulyasiya və təmir kitabxanası olan QPDF-ə əsaslanır. PikePDF PDF məzmununun çevrilməsi kitabxanasıdır və PDF fayllarına aşağı səviyyəli girişi təmin edir. Bu o deməkdir ki, istifadəçilər PDF daxili sənədləri və PDF xüsusiyyətləri ilə tanış olmalıdırlar. Kitabxana açıq mənbədir və MİT lisenziyası əsasında ictimai istifadə üçün mövcuddur. Kitabxana açıq mənbədir və MPL-2.0 Lisenziyası altında mövcuddur.
PikePDF, PDF-ləri xəttiləşdirməyə və şifrələnmiş PDF-lərə girişə dəstək verir. Sıfırdan PDF yaratmaq, səhifələri bir PDF-dən digərinə köçürmək, PDF-ləri bölmək və ya birləşdirmək, PDF-dən şəkil və ya mətn çıxarmaq, PDF-dəki məzmunu əvəz etmək, PDF-i təmir etmək üçün dəstək, səhifə kimi çox güclü PDF idarəçiliyi ilə əlaqəli funksiyalar dəsti daxildir. parametrləri dəstəkləmək, PDF metadatasını idarə etmək, parolla qorunmaqla işləmək, PDF XMP metadata redaktəsi, mövcud PDF-lərin transformasiyası və s.
.
PikePDF ilə işə başlamaq
PikePDF üçün Python 3.6 və daha yüksək versiya tələb olunur. Pip istifadə edərək PikePDF quraşdıra bilərsiniz. Quraşdırmaq üçün aşağıdakı əmrdən istifadə edin.
Pip vasitəsilə PikePDF quraşdırın
pip install pikepdf
Python vasitəsilə səhifələri bir PDF-dən digərinə kopyalayın
Açıq mənbəli PikePDF kitabxanası proqram tərtibatçılarına sadəcə bir neçə sətir Python kodu ilə səhifəni bir PDF-dən digərinə köçürməyə imkan verir. Səhifələrin PDF obyektləri arasında kopyalanması hədəf PDF faylı daxilində mənbə səhifənin dayaz nüsxəsini yaradacaq və buna görə də səhifələrin dəyişdirilməsi orijinal PDF sənədlərinə təsir etməyəcək. Xüsusi səhifələri xüsusi məzmunla əvəz etmək də mümkündür. Müəyyən bir PDF daxilində səhifələri kopyalamaq da mümkündür.
Python vasitəsilə PDF sənədlərini açın və idarə edin
# PDF Documents Manipulation
from pikepdf import Pdf
new_pdf = Pdf.new()
with Pdf.open('sample.pdf') as pdf:
pdf.save('output.pdf')
# Copying pages from other PDFs
pdf = Pdf.open('../tests/resources/fourpages.pdf')
appendix = Pdf.open('../tests/resources/sandwich.pdf')
pdf.pages.extend(appendix.pages)
Python vasitəsilə PDF Parçalanması və Birləşdirilməsi
PDF PikePDF kitabxanası proqram tərtibatçılarına mövcud PDF fayllarına daxil olmaq və onu asanlıqla bir neçə PDF faylına bölmək imkanı verir. PDF-i bölərkən bizdən tələb olunan tək şey yeni PDF-lərin təyinat səhifələrini saxlamasıdır. Kitabxana həmçinin hər səhifə ilə əlaqəli məlumatların ötürülməsinə əmin olur ki, hər səhifə öz-özünə dayansın. Kitabxana, həmçinin birdən çox PDF sənədlərini birləşdirmək və ya birləşdirməyə dəstək də daxil idi. Yalnız bir neçə sətir kodla PDF səhifələrinin sırasını dəyişmək də mümkündür.
Python vasitəsilə PDF sənədlərini parçalayın və birləşdirin
# PDF Splitting
pdf = Pdf.open('../tests/resources/fourpages.pdf')
for n, page in enumerate(pdf.pages):
dst = Pdf.new()
dst.pages.append(page)
dst.save(f'{n:02d}.pdf')
# Combine Multiple PDF pages into a single One
from glob import glob
pdf = Pdf.new()
for file in glob('*.pdf'):
src = Pdf.open(file)
pdf.pages.extend(src.pages)
pdf.save('merged.pdf')
Python vasitəsilə PDF Document daxilində Şəkilləri idarə edin
PDF PikePDF kitabxanası proqram tərtibatçılarına Python əmrlərindən istifadə edərək PDF faylı daxilində şəkilləri idarə etməyi asanlaşdırır. Kitabxana, PDF səhifəsində şəkillərin surətini çıxarmaq, PDF-i açmaq və baxmaq, şəkillərin ölçüsünü dəyişmək, PDF-də şəkilləri manipulyasiya etmək, PDF-dən şəkillər çıxarmaq, şəkilləri dəyişdirmək, PDF-dən şəkli silmək və daha çox kimi şəkillərlə işləmə ilə bağlı bir neçə vacib funksiyanı özündə birləşdirir. .
Şəkili çıxarın və Python vasitəsilə PDF-də dəyişdirin
# Extract Image & Replace PDF Images
import zlib
rawimage = pdfimage.obj
pillowimage = pdfimage.as_pil_image()
greyscale = pillowimage.convert('L')
greyscale = greyscale.resize((32, 32))
rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
rawimage.ColorSpace = Name("/DeviceGray")
rawimage.Width, rawimage.Height = 32, 32
Python vasitəsilə PDF metaməlumatlarının idarə edilməsi
PDF metadatasına müəllifin adı, yaradılma və dəyişdirilmə tarixi, açar sözlər, müəllif hüquqları haqqında məlumat və s. kimi PDF sənədi haqqında çox faydalı məlumatlar daxildir. PDF PikePDF kitabxanasına metadataya daxil olmaq və oxumaq, metadata çıxarmaq, PDF sənədlərindən metadata qeydlərini silmək üçün tam funksionallıq daxildir. Aşağıdakı kod nümunəsi PDF sənədlərindən metadataların necə çıxarılmasını göstərir.
Python vasitəsilə PDF metadatasını necə çıxarmaq olar
# Extract PDF Metadata
import pikepdf
import sys
# get the target pdf file from the command-line arguments
pdf_filename = sys.argv[1]
# read the pdf file
pdf = pikepdf.Pdf.open(pdf_filename)
docinfo = pdf.docinfo
for key, value in docinfo.items():
print(key, ":", value)