Vytvářejte a spravujte dokumenty PDF prostřednictvím bezplatného rozhraní Python API
Open Source Python knihovna pro vytváření a přizpůsobení souborů PDF, slučování více souborů PDF a extrahování textu z PDF. K převodu HTML do PDF používá Wkhtmltopdf Python Wrapper.
Python je již dlouho oblíbeným jazykem pro vývojáře softwaru a datové vědce díky své jednoduchosti a všestrannosti. Jednou z mnoha výhod Pythonu je jeho bohatý ekosystém knihoven, které pokrývají různé domény. Jednou z takových knihoven je Python-PDFKit, výkonný nástroj pro manipulaci s PDF v Pythonu. Ať už potřebujete generovat soubory PDF, extrahovat informace z existujících nebo dokonce převádět obsah HTML do PDF, Python-PDFKit vám pomůže. Knihovna se velmi snadno ovládá a umožňuje uživatelům bezproblémově generovat soubory PDF z HTML, URL nebo raw HTML řetězců.
Python-PDFKit je pythonovský obal pro populární nástroj pro převod PDF, wkhtmltopdf, který je napsán v C++. S touto knihovnou mohou vývojáři snadno integrovat generování a manipulaci s PDF do svých aplikací v Pythonu. Součástí knihovny je několik důležitých funkcí pro práci s dokumenty PDF prostřednictvím vytváření souborů PDF ze souborů HTML, vytváření souborů PDF z adres URL, přizpůsobení procesu generování PDF, přímou konverzi obsahu HTML do PDF, slučování více dokumentů PDF do jednoho souboru, správu naslouchání PDF /footers, nastavení velikosti stránky PDF a mnoho dalších.
Knihovna Python-PDFKit poskytuje intuitivní a přímočaré rozhraní pro interakci se základním nástrojem příkazového řádku wkhtmltopdf a umožňuje vývojářům softwaru snadno vytvářet, spojovat a převádět dokumenty PDF. Jeho četné možnosti konfigurace umožňují doladit výstup PDF podle konkrétních požadavků. Díky snadnému procesu instalace a přímému použití je Python-PDFKit cenným doplňkem jakékoli vývojářské sady nástrojů. Závěrem lze říci, že Python-PDFKit je knihovna, kterou musí vyzkoušet každý vývojář Pythonu, který chce zjednodušit úlohy generování PDF a snadno vytvářet profesionálně vypadající dokumenty.
Začínáme s Python-PDFKit
Doporučený a nejjednodušší způsob instalace Python-PDFKit je pomocí pip. Použijte prosím následující příkaz pro hladkou instalaci.
Nainstalujte Python-PDFKit přes pip
pip install pdfkit
Můžete jej také nainstalovat ručně; stáhněte si soubory nejnovější verze přímo z úložiště GitHub.
Extrahujte text z PDF pomocí Pythonu
Knihovna Python-PDFKit poskytuje možnost programově extrahovat text ze souborů PDF prostřednictvím Pythonu. Není snadné načíst data ze souboru PDF, protože způsob, jakým PDF ukládá informace, jen ztěžuje jejich dosažení. Python-PDFKit usnadňuje vývojářům práci tím, že jim poskytuje snadno použitelné vestavěné funkce pro získávání informací. Mohou použít metodu extractText() na objektu stránky k získání textového obsahu stránky.
Extrahujte text z PDF pomocí Pythonu
// extract text from a PDF
from Python-PDFKit import PdfReader
reader = PdfReader("example.pdf")
page = reader.pages[0]
print(page.extract_text())
Generování dokumentů PDF prostřednictvím rozhraní Python API
Knihovna Python-PDFKit s otevřeným zdrojovým kódem usnadňuje vývojářům softwaru snadno vytvářet soubory PDF v aplikacích Python. Knihovna poskytuje podporu pro generování PDF z různých zdrojů. Knihovna umožňuje vývojářům softwaru vytvářet soubory PDF ze souborů HTML, řetězců nebo dokonce adres URL. V aplikacích Pythonu je také možné přidávat obrázky, záhlaví a zápatí, nastavovat velikost stránky, nastavovat okraje a tak dále. Následující příklad ukazuje, jak mohou vývojáři softwaru generovat soubory PDF z různých zdrojů pomocí několika řádků kódu Pythonu.
Vygenerujte PDF ze souboru HTML, řetězce nebo adresy URL prostřednictvím rozhraní Python API
import pdfkit
# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")
# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!
"
pdfkit.from_string(html_string, "output.pdf")
# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")
Přizpůsobení generování PDF v aplikacích Python
Open source knihovna Python-PDFKit umožňuje vývojářům softwaru přizpůsobit proces generování PDF v rámci jejich vlastních aplikací. Vývojáři softwaru mohou specifikovat různé možnosti, jako je velikost stránky, okraje, záhlaví/zápatí, sloučení více dokumentů PDF a další. Tyto možnosti jsou předány do wkhtmltopdf jako argumenty příkazového řádku. Následující příklad ukazuje, jak mohou vývojáři softwaru přizpůsobit proces generování PDF v aplikacích Python.
Jak přizpůsobit proces generování PDF prostřednictvím rozhraní Python API?
import pdfkit
options = {
'page-size': 'A4',
'margin-top': '0mm',
'margin-right': '0mm',
'margin-bottom': '0mm',
'margin-left': '0mm',
}
pdfkit.from_file("source.html", "output.pdf", options=options)
Převeďte HTML do PDF pomocí knihovny Python
Open source knihovna Python-PDFKit je velmi snadno použitelná knihovna pro načítání a převod dokumentů HTML na soubory PDF v jejich aplikacích Python. Kromě generování PDF může knihovna převádět obsah HTML do PDF přímo bez ukládání přechodného souboru. To může být užitečné při práci s dynamickým obsahem nebo při generování PDF za běhu. Níže je jednoduchý příklad, který ukazuje, jak mohou počítačoví programátoři převádět dokumenty HTML na soubory PDF v aplikacích Python.
Jak převést dokumenty HTML na soubory PDF pomocí Pythonu?
import pdfkit
html_string = "Hello, PDFKit!
"
pdf_bytes = pdfkit.from_string(html_string, False)
# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
f.write(pdf_bytes)