1. Termékek
  2.   PDF
  3.   Python
  4.   Python-PDFKit
 
  

PDF-dokumentumok létrehozása és kezelése ingyenes Python API-n keresztül

Nyílt forráskódú Python-könyvtár PDF-fájlok létrehozásához és testreszabásához, több PDF egyesítéséhez és szöveg kivonásához a PDF-ből. A Wkhtmltopdf Python Wrapper segítségével konvertálja a HTML-t PDF-be.

A Python egyszerűsége és sokoldalúsága miatt régóta a szoftverfejlesztők és adattudósok kedvelt nyelve. A Python egyik előnye a gazdag könyvtárak ökoszisztémája, amelyek különböző tartományokat fednek le. Az egyik ilyen könyvtár a Python-PDFKit, amely egy hatékony eszköz a Python PDF-kezelésére. Függetlenül attól, hogy PDF-eket kell generálnia, információkat kell kinyernie a meglévőkből, vagy akár HTML-tartalmat kell PDF-be konvertálnia, a Python-PDFKit mindent megtesz. A könyvtár nagyon könnyen kezelhető, és lehetővé teszi a felhasználók számára, hogy zökkenőmentesen generáljanak PDF-eket HTML-ből, URL-ből vagy nyers HTML-karakterláncokból.

A Python-PDFKit egy Python-burkoló a népszerű PDF konvertáló eszközhöz, a wkhtmltopdf-hez, amely C++ nyelven íródott. Ezzel a könyvtárral a fejlesztők könnyedén integrálhatják a PDF-generálást és -kezelést Python-alkalmazásaikba. A könyvtárnak számos fontos funkciója van a PDF-dokumentumok kezeléséhez: PDF-ek létrehozása HTML-fájlokból, PDF-ek létrehozása URL-ekből, a PDF-generálási folyamat testreszabása, a HTML-tartalom közvetlen konvertálása PDF-be, több PDF-dokumentum egyetlen fájlba egyesítése, PDF-hallgatások kezelése. /footers, a PDF oldalméretének beállítása és még sok más.

A Python-PDFKit könyvtár intuitív és egyszerű felületet biztosít a mögöttes wkhtmltopdf parancssori eszközzel való interakcióhoz, lehetővé téve a szoftverfejlesztők számára, hogy könnyedén hozzanak létre, egyesítsenek és konvertáljanak PDF dokumentumokat. Számos konfigurációs opciója lehetővé teszi a PDF-kimenet finomhangolását az egyedi követelményeknek megfelelően. Könnyű telepítési folyamatával és egyszerű használatával a Python-PDFKit értékes kiegészítője bármely fejlesztő eszköztárának. Összefoglalva, a Python-PDFKit egy kihagyhatatlan könyvtár minden Python-fejlesztő számára, aki egyszerűsíteni szeretné a PDF-generálási feladatokat, és könnyedén készíthet professzionális megjelenésű dokumentumokat.

Previous Next

Kezdő lépések a Python-PDFKit használatával

A Python-PDFKit telepítésének javasolt és legegyszerűbb módja a pip használata. Kérjük, használja a következő parancsot a zökkenőmentes telepítéshez.

Telepítse a Python-PDFKit -t pip-en keresztül

 pip install pdfkit 

Kézzel is telepítheti; töltse le a legújabb kiadású fájlokat közvetlenül a GitHub tárhelyről.

Szöveg kibontása PDF-ből Python segítségével

A Python-PDFKit könyvtár lehetőséget biztosít a szöveg programozott kivonására PDF-fájlokból Python segítségével. Nem könnyű adatokat lekérni egy PDF-fájlból, mert a PDF-fájlok tárolási módja megnehezíti az adatok elérését. A Python-PDFKit megkönnyíti a fejlesztők munkáját azáltal, hogy könnyen használható beépített funkciókat biztosít az információk lekéréséhez. Használhatják az extractText() metódust az oldalobjektumban, hogy megkapják az oldal szöveges tartalmát.

Szöveg kibontása PDF-ből Python segítségével

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

PDF-dokumentumok generálása Python API-n keresztül

A nyílt forráskódú Python-PDFKit könyvtár megkönnyíti a szoftverfejlesztők számára a PDF-fájlok egyszerű létrehozását Python-alkalmazásaikon belül. A könyvtár támogatást nyújtott különféle forrásokból származó PDF-ek előállításához. A könyvtár lehetővé teszi a szoftverfejlesztők számára, hogy PDF-eket hozzanak létre HTML-fájlokból, karakterláncokból vagy akár URL-ekből. A Python alkalmazásokon belül is lehetőség van képek, fejlécek és láblécek hozzáadására, oldalméret beállítására, margók beállítására és így tovább. A következő példa bemutatja, hogy a szoftverfejlesztők hogyan hozhatnak létre PDF-fájlokat különböző forrásokból mindössze néhány soros Python-kóddal.

PDF létrehozása HTML-fájlból, karakterláncból vagy URL-ből Python API-n keresztül

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

PDF-generálás testreszabása a Python-alkalmazásokon belül

A nyílt forráskódú Python-PDFKit könyvtár lehetővé teszi a szoftverfejlesztők számára, hogy személyre szabják a PDF-előállítási folyamatot saját alkalmazásaikban. A szoftverfejlesztők különféle beállításokat adhatnak meg, mint például az oldalméret, a margók, a fejlécek/láblécek, több PDF dokumentum egyesítése stb. Ezeket a beállításokat a wkhtmltopdf parancssori argumentumként adja át. A következő példa bemutatja, hogy a szoftverfejlesztők hogyan szabhatják testre a PDF-előállítási folyamatot a Python-alkalmazásokon belül.

Hogyan lehet személyre szabni a PDF-előállítási folyamatot Python API-n keresztül?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

HTML konvertálása PDF-be a Python Library segítségével

A nyílt forráskódú Python-PDFKit könyvtár egy nagyon könnyen használható könyvtár HTML-dokumentumok betöltésére és PDF-fájlokká konvertálására a Python-alkalmazásokon belül. A PDF-ek generálása mellett a könyvtár közvetlenül konvertálhat HTML-tartalmat PDF-be, közbenső fájl mentése nélkül. Ez hasznos lehet dinamikus tartalom kezelésekor vagy menet közbeni PDF-ek generálásakor. Az alábbiakban egy egyszerű példa bemutatja, hogy a számítógép-programozók hogyan konvertálhatnak HTML-dokumentumokat PDF-fájlokká Python-alkalmazásokon belül.

 

Hogyan lehet HTML-dokumentumokat PDF-fájlokká konvertálni Python segítségével?

import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 Magyar