Vytvářejte a spravujte dokumenty PDF prostřednictvím bezplatného rozhraní Python API

Open Source Python knihovna pro vytváření a přizpůsobení souborů PDF, slučování více souborů PDF a extrahování textu z PDF. K převodu HTML do PDF používá Wkhtmltopdf Python Wrapper.

Python je již dlouho oblíbeným jazykem pro vývojáře softwaru a datové vědce díky své jednoduchosti a všestrannosti. Jednou z mnoha výhod Pythonu je jeho bohatý ekosystém knihoven, které pokrývají různé domény. Jednou z takových knihoven je Python-PDFKit, výkonný nástroj pro manipulaci s PDF v Pythonu. Ať už potřebujete generovat soubory PDF, extrahovat informace z existujících nebo dokonce převádět obsah HTML do PDF, Python-PDFKit vám pomůže. Knihovna se velmi snadno ovládá a umožňuje uživatelům bezproblémově generovat soubory PDF z HTML, URL nebo raw HTML řetězců.

Python-PDFKit je pythonovský obal pro populární nástroj pro převod PDF, wkhtmltopdf, který je napsán v C++. S touto knihovnou mohou vývojáři snadno integrovat generování a manipulaci s PDF do svých aplikací v Pythonu. Součástí knihovny je několik důležitých funkcí pro práci s dokumenty PDF prostřednictvím vytváření souborů PDF ze souborů HTML, vytváření souborů PDF z adres URL, přizpůsobení procesu generování PDF, přímou konverzi obsahu HTML do PDF, slučování více dokumentů PDF do jednoho souboru, správu naslouchání PDF /footers, nastavení velikosti stránky PDF a mnoho dalších.

Knihovna Python-PDFKit poskytuje intuitivní a přímočaré rozhraní pro interakci se základním nástrojem příkazového řádku wkhtmltopdf a umožňuje vývojářům softwaru snadno vytvářet, spojovat a převádět dokumenty PDF. Jeho četné možnosti konfigurace umožňují doladit výstup PDF podle konkrétních požadavků. Díky snadnému procesu instalace a přímému použití je Python-PDFKit cenným doplňkem jakékoli vývojářské sady nástrojů. Závěrem lze říci, že Python-PDFKit je knihovna, kterou musí vyzkoušet každý vývojář Pythonu, který chce zjednodušit úlohy generování PDF a snadno vytvářet profesionálně vypadající dokumenty.

Na první pohled

Přehled funkcí Python-PDFKit.

Přehled funkcí

Vytvořit PDF
Oříznout PDF
Převést HTML do PDF
Rozdělit soubory PDF
Sloučit soubory PDF
Vkládání hypertextových odkazů
Vložte kruhy
Přidat vlastní údaje
Přidat tvary
Podpora Unicode
Vkládání písma
Šifrování PDF
Vkládání obrázků
Přidejte hesla
Metadata

Python-PDFKit

Python-PDFKit podporuje formát souborů PDF i standardní formáty pro export.

Čtenář

Spisovatel

TXT, HTML

Python-PDFKit

Nezávislost na platformě

Python-PDFKit je testován s Pythonem 2.6 a vyšším.

Python 2.6 a vyšší

Python-PDFKit

Začínáme s Python-PDFKit

Doporučený a nejjednodušší způsob instalace Python-PDFKit je pomocí pip. Použijte prosím následující příkaz pro hladkou instalaci.

Nainstalujte Python-PDFKit přes pip

 pip install pdfkit

Můžete jej také nainstalovat ručně; stáhněte si soubory nejnovější verze přímo z úložiště GitHub.

Extrahujte text z PDF pomocí Pythonu

Knihovna Python-PDFKit poskytuje možnost programově extrahovat text ze souborů PDF prostřednictvím Pythonu. Není snadné načíst data ze souboru PDF, protože způsob, jakým PDF ukládá informace, jen ztěžuje jejich dosažení. Python-PDFKit usnadňuje vývojářům práci tím, že jim poskytuje snadno použitelné vestavěné funkce pro získávání informací. Mohou použít metodu extractText() na objektu stránky k získání textového obsahu stránky.

Extrahujte text z PDF pomocí Pythonu

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text())

Generování dokumentů PDF prostřednictvím rozhraní Python API

Knihovna Python-PDFKit s otevřeným zdrojovým kódem usnadňuje vývojářům softwaru snadno vytvářet soubory PDF v aplikacích Python. Knihovna poskytuje podporu pro generování PDF z různých zdrojů. Knihovna umožňuje vývojářům softwaru vytvářet soubory PDF ze souborů HTML, řetězců nebo dokonce adres URL. V aplikacích Pythonu je také možné přidávat obrázky, záhlaví a zápatí, nastavovat velikost stránky, nastavovat okraje a tak dále. Následující příklad ukazuje, jak mohou vývojáři softwaru generovat soubory PDF z různých zdrojů pomocí několika řádků kódu Pythonu.

Vygenerujte PDF ze souboru HTML, řetězce nebo adresy URL prostřednictvím rozhraní Python API

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!"
pdfkit.from_string(html_string, "output.pdf")

# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")

Přizpůsobení generování PDF v aplikacích Python

Open source knihovna Python-PDFKit umožňuje vývojářům softwaru přizpůsobit proces generování PDF v rámci jejich vlastních aplikací. Vývojáři softwaru mohou specifikovat různé možnosti, jako je velikost stránky, okraje, záhlaví/zápatí, sloučení více dokumentů PDF a další. Tyto možnosti jsou předány do wkhtmltopdf jako argumenty příkazového řádku. Následující příklad ukazuje, jak mohou vývojáři softwaru přizpůsobit proces generování PDF v aplikacích Python.

Jak přizpůsobit proces generování PDF prostřednictvím rozhraní Python API?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

Převeďte HTML do PDF pomocí knihovny Python

Open source knihovna Python-PDFKit je velmi snadno použitelná knihovna pro načítání a převod dokumentů HTML na soubory PDF v jejich aplikacích Python. Kromě generování PDF může knihovna převádět obsah HTML do PDF přímo bez ukládání přechodného souboru. To může být užitečné při práci s dynamickým obsahem nebo při generování PDF za běhu. Níže je jednoduchý příklad, který ukazuje, jak mohou počítačoví programátoři převádět dokumenty HTML na soubory PDF v aplikacích Python.

Jak převést dokumenty HTML na soubory PDF pomocí Pythonu?

import pdfkit

html_string = "Hello, PDFKit!"
pdf_bytes = pdfkit.from_string(html_string, False)

# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
    f.write(pdf_bytes)