Bina Apl untuk Bekerja dengan PDF melalui Perpustakaan Python

Open Source Python API mampu Memisahkan, Mencantum, Memangkas dan Mengubah halaman fail PDF, menambahkan data tersuai & Kata Laluan kepada PDF.

PyPDF2 ialah perpustakaan Python tulen sumber terbuka yang menyediakan keupayaan untuk bekerja dengan fail PDF dalam aplikasi Python tanpa sebarang kebergantungan luaran. Perpustakaan ini telah menyertakan sokongan untuk pelbagai ciri PDF penting seperti menggabungkan berbilang fail PDF, mengekstrak kandungan fail PDF, memutar halaman fail PDF mengikut sudut, menskala halaman PDF, mengubah halaman fail PDF, mengekstrak imej daripada halaman PDF dan banyak lagi.

Pustaka pengaturcaraan sumber terbuka PyPDF2 sangat mudah untuk digunakan dan kod sumber didokumentasikan dengan baik dan mudah difahami. Perpustakaan membolehkan pembangun membaca dan mengekstrak metadata Fail PDF seperti bilangan halaman, pengarang, pencipta, masa dicipta dan terakhir dikemas kini, dsb. Perpustakaan juga menyokong penyulitan dan penyahsulitan fail PDF dengan hanya beberapa baris kod Python.

Sekali pandang

Gambaran keseluruhan ciri PyPDF2.

Gambaran Keseluruhan Ciri

Buat PDF
Potong
Ubah Halaman PDF
Pisahkan PDF
Gabungkan PDF
Membenamkan hiperpautan
Sisipkan bulatan
Tambahkan data tersuai
Tambah bentuk
Sokongan Unicode
Pembenaman fon
Sulitkan PDF
Membenamkan imej
Tambah kata laluan
Metadata

PyPDF2

PyPDF2 menyokong format fail PDF serta format standard industri untuk eksport.

Pembaca

Penulis

TXT, HTML

PyPDF2

Kemerdekaan Platform

PyPDF2 diuji dengan Python 2.6 dan lebih tinggi.

Python 2.6 & lebih tinggi

PyPDF2

Bermula dengan PyPDF2

PyPDF2 tidak disertakan sebagai sebahagian daripada Perpustakaan Standard Python, jadi anda perlu memasangnya sendiri. Cara pilihan untuk berbuat demikian ialah menggunakan pip.

Pasang PyPDF2 melalui pip

 python -m pip install pypdf2

Ekstrak Teks daripada PDF melalui Python

Pustaka PyPDF2 menyediakan keupayaan untuk mengekstrak teks secara pemrograman daripada fail PDF melalui Python. Bukan mudah untuk mendapatkan semula data daripada fail PDF kerana cara PDF menyimpan maklumat hanya menyukarkan untuk mencapainya. PyPDF2 memudahkan kerja pembangun dengan menyediakan fungsi terbina dalam yang mudah digunakan untuk mendapatkan maklumat. Mereka boleh menggunakan kaedah extractText() pada objek halaman untuk mendapatkan kandungan teks halaman.

Ekstrak Teks daripada PDF melalui Python

 // extract text from a PDF
  from PyPDF2 import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text())

Membaca Fail PDF melalui Python

 // Reading text from a PDF
    from PyPDF2 import PdfReader
  reader = PdfReader("example.pdf")
  for page in reader.pages:
    if "/Annots" in page:
      for annot in page["/Annots"]:
        subtype = annot.get_object()["/Subtype"]
        if subtype == "/Text":
          print(annot.get_object()["/Contents"])

Gabung atau Pisahkan Dokumen PDF

Pernahkah anda berada dalam situasi di mana anda perlu menggabungkan dua atau lebih fail PDF ke dalam satu dokumen? Organisasi sering memerlukan penggabungan berbilang fail PDF ke dalam satu dokumen. Pustaka PyPDF2 menyediakan keupayaan untuk menggabungkan fail PDF dengan hanya beberapa baris kod Python. Pembangun juga boleh dengan mudah memisahkan dokumen PDF yang besar kepada yang lebih kecil mengikut keperluan mereka. Pembangun boleh mengekstrak bahagian tertentu buku PDF dengan mudah atau membahagikannya kepada berbilang PDF

Gabungkan Fail PDF melalui Python

 // Merge PDF files 
  from PyPDF2 import PdfMerger
  merger = PdfMerger()
  for pdf in ["file1.pdf", "file2.pdf", "file3.pdf"]:
    merger.append(pdf)
  merger.write("merged-pdf.pdf")
  merger.close()

Ekstrak Metadata daripada Fail PDF

Pustaka PyPDF2 telah menyertakan fungsi untuk mengekstrak Metadata daripada dokumen PDF dengan menggunakan beberapa arahan Python. Anda boleh mendapatkan maklumat dengan mudah tentang pengarang, apl pencipta, bilangan halaman, tajuk dokumen dan tarikh penciptaan, dsb. Anda boleh mengekstrak metadata dokumen PDF dengan mudah dan menggunakannya mengikut keperluan anda.

Ekstrak Metadata daripada PDF melalui Python

 // Reading PDF Metadata 
  from PyPDF2 import PdfReader
reader = PdfReader("example.pdf")
meta = reader.metadata
print(len(reader.pages))
# All of the following could be None!
print(meta.author)
print(meta.creator)
print(meta.producer)
print(meta.subject)
print(meta.title)