Nyílt forráskódú Python-könyvtár PDF-fájlok konvertálásához
Az ingyenes Python API lehetővé teszi a fejlesztők számára a PDF-fájlok exportálását, elforgatását, egyesítését és összefűzését, valamint adatok és elemek PDF-ekből való kibontását.
A pdfrw egy nyílt forráskódú, tiszta Python-könyvtár, amely lehetővé teszi a szoftverfejlesztők számára PDF-fájlok olvasását és írását külső speciális szoftver telepítése nélkül. A pdfrw programkönyvtár nagyon egyszerűenhasználható, a forráskód pedig jól dokumentált, nagyon egyszerű és könnyen érthető. A könyvtár tartalmazza a megfelelő Unicode-támogatást a PDF-fájlok szöveges karakterláncaihoz, valamint a leggyorsabb, tiszta Python PDF-elemzőt.
A pdfrw könyvtár számos fontos PDF-műveletet támogat, például PDF-ek egyesítését, metaadatok módosítását, több PDF összefűzését, képek kibontását, PDF-nyomtatást, PDF-oldalak elforgatását, új PDF létrehozását, vízjel PDF-kép hozzáadása és még sok más.
.
A pdfrw használatának megkezdése
A pdfrw használatához Python 2.6, 2.7, 3.3, 3.4, 3.5 és 3.6 szükséges. A pdfrw-t a pip segítségével telepítheti. Kérjük, használja a következő parancsot a telepítéshez.
Telepítse a pdfrw-t pip-n keresztül
python -m pip install pdfrw
Hozzon létre PDF dokumentumokat a Python Library segítségével
A pdfrw könyvtár lehetővé teszi a szoftverfejlesztők számára PDF-dokumentumok létrehozását saját Python-alkalmazásaikon belül, mindössze néhány sornyi kóddal. A könyvtár támogatja a meglévő PDF fájlok elérését és módosítását is. Könnyedén illeszthet be új oldalakat, valamint grafikus komponenseket vagy szöveges elemeket a meglévő PDF-be. A pdfrw könyvtár támogatást nyújt a beolvasott PDF-fájlok oldalainak megtalálásához, és az oldalak új PDF-fájlba való visszaírásához.
PDF-dokumentumok létrehozása és módosítása Python segítségével
// PDF Documents Creation
import sys
import os
from pdfrw import PdfReader, PdfWriter
inpfn, = sys.argv[1:]
outfn = 'alter.' + os.path.basename(inpfn)
trailer = PdfReader(inpfn)
trailer.Info.Title = 'My New Title Goes Here'
PdfWriter(outfn, trailer=trailer).write()
PDF fájlok olvasása Python segítségével
A pdfrw könyvtár segítségével a szoftverfejlesztők könnyedén elérhetik és elolvashatják a PDF-dokumentumok különböző részeit a Python-alkalmazásokon belül. Könnyű hozzáférést biztosít a teljes PDF dokumentumhoz. A könyvtár támogatja a fájladatok, a méret és egyebek lekérését. Létrehoz egy speciális, pages nevű attribútumot, amely lehetővé teszi a felhasználók számára, hogy a PDF-dokumentum összes oldalát felsorolják. Lehetővé teszi egy dokumentuminformációs objektum kinyerését, amellyel olyan információkat húzhat ki, mint a szerző, cím stb.
PDF-fájlok elérése és olvasása Python segítségével
// Reading PDF Files
from pdfrw import pdfreader
def get_pdf_info(path):
pdf = pdfreader(path)
print(pdf.keys())
print(pdf.info)
print(pdf.root.keys())
print('pdf has {} pages'.format(len(pdf.pages)))
if __name__ == '__main__':
get_pdf_info('w9.pdf')
Metaadatok hozzáadása vagy módosítása
A pdfrw lehetővé teszi a szoftverfejlesztők számára, hogy hozzáadják vagy módosítsák a PDF-fájlok metaadatait saját Python-alkalmazásaikon belül. Módosíthat egyetlen metaadat-elemet a PDF-ben, az eredményt új PDF-be írja, valamint több fájlt is tartalmazhat, és összefűzheti őket, miután néhány értelmetlen metaadatot hozzáadott a kimeneti PDF-fájlhoz.
Módosítsa a PDF metaadatokat Python segítségével
// Modifying PDF Metadata
import sys
import os
from pdfrw import PdfReader, PdfWriter
inpfn, = sys.argv[1:]
outfn = 'alter.' + os.path.basename(inpfn)
trailer = PdfReader(inpfn)
trailer.Info.Title = 'My New Title Goes Here'
PdfWriter(outfn, trailer=trailer).write()
PDF dokumentumok felosztása
A pdfrw segítségével a szoftverfejlesztők programozottan feloszthatják a PDF-dokumentumokat az alkalmazásaikban. Előfordulhat, hogy a felhasználó egy PDF-könyv egy bizonyos részét ki kell bontani, vagy több PDF-re kell felosztani ahelyett, hogy egy fájlban tárolná azokat. Ez nagyon egyszerű a pdfrw könyvtárral, csak meg kell adnia a bemeneti PDF fájl elérési útját, a kivonatolni kívánt oldalak számát és a kimeneti útvonalat.
PDF-fájl felosztása több PDF-fájlra Python segítségével
// Splitting PDF file into multiple pdfs
from pdfrw import pdfreader, pdfwriter
def split(path, number_of_pages, output):
pdf_obj = pdfreader(path)
total_pages = len(pdf_obj.pages)
writer = pdfwriter()
for page in range(number_of_pages):
if page <= total_pages:
writer.addpage(pdf_obj.pages[page])
writer.write(output)
if __name__ == '__main__':
split('reportlab-sample.pdf', 10, 'subset.pdf')