1. Produk
  2.   PDF
  3.   Python
  4.   Pypdf2
 
  

Bina Apl untuk Bekerja dengan PDF melalui Perpustakaan Python

Open Source Python API mampu Memisahkan, Mencantum, Memangkas dan Mengubah halaman fail PDF, menambahkan data tersuai & Kata Laluan kepada PDF.

PyPDF2 ialah perpustakaan Python tulen sumber terbuka yang menyediakan keupayaan untuk bekerja dengan fail PDF dalam aplikasi Python tanpa sebarang kebergantungan luaran. Perpustakaan ini telah menyertakan sokongan untuk pelbagai ciri PDF penting seperti menggabungkan berbilang fail PDF, mengekstrak kandungan fail PDF, memutar halaman fail PDF mengikut sudut, menskala halaman PDF, mengubah halaman fail PDF, mengekstrak imej daripada halaman PDF dan banyak lagi.

Pustaka pengaturcaraan sumber terbuka PyPDF2 sangat mudah untuk digunakan dan kod sumber didokumentasikan dengan baik dan mudah difahami. Perpustakaan membolehkan pembangun membaca dan mengekstrak metadata Fail PDF seperti bilangan halaman, pengarang, pencipta, masa dicipta dan terakhir dikemas kini, dsb. Perpustakaan juga menyokong penyulitan dan penyahsulitan fail PDF dengan hanya beberapa baris kod Python.

.

Previous Next

Bermula dengan PyPDF2

PyPDF2 tidak disertakan sebagai sebahagian daripada Perpustakaan Standard Python, jadi anda perlu memasangnya sendiri. Cara pilihan untuk berbuat demikian ialah menggunakan pip.

Pasang PyPDF2  melalui pip

 python -m pip install pypdf2  

Ekstrak Teks daripada PDF melalui Python

Pustaka PyPDF2 menyediakan keupayaan untuk mengekstrak teks secara pemrograman daripada fail PDF melalui Python. Bukan mudah untuk mendapatkan semula data daripada fail PDF kerana cara PDF menyimpan maklumat hanya menyukarkan untuk mencapainya. PyPDF2 memudahkan kerja pembangun dengan menyediakan fungsi terbina dalam yang mudah digunakan untuk mendapatkan maklumat. Mereka boleh menggunakan kaedah extractText() pada objek halaman untuk mendapatkan kandungan teks halaman.

Ekstrak Teks daripada PDF melalui Python

 // extract text from a PDF
  from PyPDF2 import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

Membaca Fail PDF melalui Python

Pustaka PyPDF2 menyediakan keupayaan untuk mengekstrak teks secara pemrograman daripada fail PDF melalui Python. Bukan mudah untuk mendapatkan semula data daripada fail PDF kerana cara PDF menyimpan maklumat hanya menyukarkan untuk mencapainya. PyPDF2 memudahkan kerja pembangun dengan menyediakan fungsi terbina dalam yang mudah digunakan untuk mendapatkan maklumat. Mereka boleh menggunakan kaedah extractText() pada objek halaman untuk mendapatkan kandungan teks halaman.

Membaca Fail PDF melalui Python

 // Reading text from a PDF
    from PyPDF2 import PdfReader
  reader = PdfReader("example.pdf")
  for page in reader.pages:
    if "/Annots" in page:
      for annot in page["/Annots"]:
        subtype = annot.get_object()["/Subtype"]
        if subtype == "/Text":
          print(annot.get_object()["/Contents"]) 

Gabung atau Pisahkan Dokumen PDF

Pernahkah anda berada dalam situasi di mana anda perlu menggabungkan dua atau lebih fail PDF ke dalam satu dokumen? Organisasi sering memerlukan penggabungan berbilang fail PDF ke dalam satu dokumen. Pustaka PyPDF2 menyediakan keupayaan untuk menggabungkan fail PDF dengan hanya beberapa baris kod Python. Pembangun juga boleh dengan mudah memisahkan dokumen PDF yang besar kepada yang lebih kecil mengikut keperluan mereka. Pembangun boleh mengekstrak bahagian tertentu buku PDF dengan mudah atau membahagikannya kepada berbilang PDF

Gabungkan Fail PDF melalui Python

 // Merge PDF files 
  from PyPDF2 import PdfMerger
  merger = PdfMerger()
  for pdf in ["file1.pdf", "file2.pdf", "file3.pdf"]:
    merger.append(pdf)
  merger.write("merged-pdf.pdf")
  merger.close()

Ekstrak Metadata daripada Fail PDF

Pustaka PyPDF2 telah menyertakan fungsi untuk mengekstrak Metadata daripada dokumen PDF dengan menggunakan beberapa arahan Python. Anda boleh mendapatkan maklumat dengan mudah tentang pengarang, apl pencipta, bilangan halaman, tajuk dokumen dan tarikh penciptaan, dsb. Anda boleh mengekstrak metadata dokumen PDF dengan mudah dan menggunakannya mengikut keperluan anda.

 

Ekstrak Metadata daripada PDF melalui Python

 // Reading PDF Metadata 
  from PyPDF2 import PdfReader
reader = PdfReader("example.pdf")
meta = reader.metadata
print(len(reader.pages))
# All of the following could be None!
print(meta.author)
print(meta.creator)
print(meta.producer)
print(meta.subject)
print(meta.title)
 Melayu