1. Termékek
  2.   PDF
  3.   Python
  4.   Pdfrw
 
  

Nyílt forráskódú Python-könyvtár PDF-fájlok konvertálásához

Az ingyenes Python API lehetővé teszi a fejlesztők számára a PDF-fájlok exportálását, elforgatását, egyesítését és összefűzését, valamint adatok és elemek PDF-ekből való kibontását.

A pdfrw egy nyílt forráskódú, tiszta Python-könyvtár, amely lehetővé teszi a szoftverfejlesztők számára PDF-fájlok olvasását és írását külső speciális szoftver telepítése nélkül. A pdfrw programkönyvtár nagyon egyszerűenhasználható, a forráskód pedig jól dokumentált, nagyon egyszerű és könnyen érthető. A könyvtár tartalmazza a megfelelő Unicode-támogatást a PDF-fájlok szöveges karakterláncaihoz, valamint a leggyorsabb, tiszta Python PDF-elemzőt.

A pdfrw könyvtár számos fontos PDF-műveletet támogat, például PDF-ek egyesítését, metaadatok módosítását, több PDF összefűzését, képek kibontását, PDF-nyomtatást, PDF-oldalak elforgatását, új PDF létrehozását, vízjel PDF-kép hozzáadása és még sok más.

.

Previous Next

A pdfrw használatának megkezdése

A pdfrw használatához Python 2.6, 2.7, 3.3, 3.4, 3.5 és 3.6 szükséges. A pdfrw-t a pip segítségével telepítheti. Kérjük, használja a következő parancsot a telepítéshez.

Telepítse a pdfrw-t pip-n keresztül

 python -m pip install pdfrw  

Hozzon létre PDF dokumentumokat a Python Library segítségével

A pdfrw könyvtár lehetővé teszi a szoftverfejlesztők számára PDF-dokumentumok létrehozását saját Python-alkalmazásaikon belül, mindössze néhány sornyi kóddal. A könyvtár támogatja a meglévő PDF fájlok elérését és módosítását is. Könnyedén illeszthet be új oldalakat, valamint grafikus komponenseket vagy szöveges elemeket a meglévő PDF-be. A pdfrw könyvtár támogatást nyújt a beolvasott PDF-fájlok oldalainak megtalálásához, és az oldalak új PDF-fájlba való visszaírásához.

PDF-dokumentumok létrehozása és módosítása Python segítségével

 // PDF Documents Creation 
  import sys
  import os
  from pdfrw import PdfReader, PdfWriter
  inpfn, = sys.argv[1:]
  outfn = 'alter.' + os.path.basename(inpfn)
  trailer = PdfReader(inpfn)
  trailer.Info.Title = 'My New Title Goes Here'
  PdfWriter(outfn, trailer=trailer).write() 

PDF fájlok olvasása Python segítségével

A pdfrw könyvtár segítségével a szoftverfejlesztők könnyedén elérhetik és elolvashatják a PDF-dokumentumok különböző részeit a Python-alkalmazásokon belül. Könnyű hozzáférést biztosít a teljes PDF dokumentumhoz. A könyvtár támogatja a fájladatok, a méret és egyebek lekérését. Létrehoz egy speciális, pages nevű attribútumot, amely lehetővé teszi a felhasználók számára, hogy a PDF-dokumentum összes oldalát felsorolják. Lehetővé teszi egy dokumentuminformációs objektum kinyerését, amellyel olyan információkat húzhat ki, mint a szerző, cím stb.

PDF-fájlok elérése és olvasása Python segítségével

 // Reading PDF Files
  from pdfrw import pdfreader
  def get_pdf_info(path):
    pdf = pdfreader(path)
    print(pdf.keys())
    print(pdf.info)
    print(pdf.root.keys())
    print('pdf has {} pages'.format(len(pdf.pages)))
  if __name__ == '__main__':
    get_pdf_info('w9.pdf')

Metaadatok hozzáadása vagy módosítása

A pdfrw lehetővé teszi a szoftverfejlesztők számára, hogy hozzáadják vagy módosítsák a PDF-fájlok metaadatait saját Python-alkalmazásaikon belül. Módosíthat egyetlen metaadat-elemet a PDF-ben, az eredményt új PDF-be írja, valamint több fájlt is tartalmazhat, és összefűzheti őket, miután néhány értelmetlen metaadatot hozzáadott a kimeneti PDF-fájlhoz.

Módosítsa a PDF metaadatokat Python segítségével

 // Modifying PDF Metadata
  import sys
  import os
  from pdfrw import PdfReader, PdfWriter
  inpfn, = sys.argv[1:]
  outfn = 'alter.' + os.path.basename(inpfn)
  trailer = PdfReader(inpfn)
  trailer.Info.Title = 'My New Title Goes Here'
  PdfWriter(outfn, trailer=trailer).write() 

PDF dokumentumok felosztása

A pdfrw segítségével a szoftverfejlesztők programozottan feloszthatják a PDF-dokumentumokat az alkalmazásaikban. Előfordulhat, hogy a felhasználó egy PDF-könyv egy bizonyos részét ki kell bontani, vagy több PDF-re kell felosztani ahelyett, hogy egy fájlban tárolná azokat. Ez nagyon egyszerű a pdfrw könyvtárral, csak meg kell adnia a bemeneti PDF fájl elérési útját, a kivonatolni kívánt oldalak számát és a kimeneti útvonalat.

PDF-fájl felosztása több PDF-fájlra Python segítségével

 // Splitting PDF file into multiple pdfs
  from pdfrw import pdfreader, pdfwriter
  def split(path, number_of_pages, output):
    pdf_obj = pdfreader(path)
    total_pages = len(pdf_obj.pages)
    writer = pdfwriter()
    for page in range(number_of_pages):
      if page <= total_pages:
        writer.addpage(pdf_obj.pages[page])
    writer.write(output)
  if __name__ == '__main__':
    split('reportlab-sample.pdf', 10, 'subset.pdf')
 Magyar