1. produkty
  2.   PDF
  3.   Python
  4.   Python-PDFKit
 
  

Vytvářejte a spravujte dokumenty PDF prostřednictvím bezplatného rozhraní Python API

Open Source Python knihovna pro vytváření a přizpůsobení souborů PDF, slučování více souborů PDF a extrahování textu z PDF. K převodu HTML do PDF používá Wkhtmltopdf Python Wrapper.

Python je již dlouho oblíbeným jazykem pro vývojáře softwaru a datové vědce díky své jednoduchosti a všestrannosti. Jednou z mnoha výhod Pythonu je jeho bohatý ekosystém knihoven, které pokrývají různé domény. Jednou z takových knihoven je Python-PDFKit, výkonný nástroj pro manipulaci s PDF v Pythonu. Ať už potřebujete generovat soubory PDF, extrahovat informace z existujících nebo dokonce převádět obsah HTML do PDF, Python-PDFKit vám pomůže. Knihovna se velmi snadno ovládá a umožňuje uživatelům bezproblémově generovat soubory PDF z HTML, URL nebo raw HTML řetězců.

Python-PDFKit je pythonovský obal pro populární nástroj pro převod PDF, wkhtmltopdf, který je napsán v C++. S touto knihovnou mohou vývojáři snadno integrovat generování a manipulaci s PDF do svých aplikací v Pythonu. Součástí knihovny je několik důležitých funkcí pro práci s dokumenty PDF prostřednictvím vytváření souborů PDF ze souborů HTML, vytváření souborů PDF z adres URL, přizpůsobení procesu generování PDF, přímou konverzi obsahu HTML do PDF, slučování více dokumentů PDF do jednoho souboru, správu naslouchání PDF /footers, nastavení velikosti stránky PDF a mnoho dalších.

Knihovna Python-PDFKit poskytuje intuitivní a přímočaré rozhraní pro interakci se základním nástrojem příkazového řádku wkhtmltopdf a umožňuje vývojářům softwaru snadno vytvářet, spojovat a převádět dokumenty PDF. Jeho četné možnosti konfigurace umožňují doladit výstup PDF podle konkrétních požadavků. Díky snadnému procesu instalace a přímému použití je Python-PDFKit cenným doplňkem jakékoli vývojářské sady nástrojů. Závěrem lze říci, že Python-PDFKit je knihovna, kterou musí vyzkoušet každý vývojář Pythonu, který chce zjednodušit úlohy generování PDF a snadno vytvářet profesionálně vypadající dokumenty.

Previous Next

Začínáme s Python-PDFKit

Doporučený a nejjednodušší způsob instalace Python-PDFKit je pomocí pip. Použijte prosím následující příkaz pro hladkou instalaci.

Nainstalujte Python-PDFKit  přes pip

 pip install pdfkit 

Můžete jej také nainstalovat ručně; stáhněte si soubory nejnovější verze přímo z úložiště GitHub.

Extrahujte text z PDF pomocí Pythonu

Knihovna Python-PDFKit poskytuje možnost programově extrahovat text ze souborů PDF prostřednictvím Pythonu. Není snadné načíst data ze souboru PDF, protože způsob, jakým PDF ukládá informace, jen ztěžuje jejich dosažení. Python-PDFKit usnadňuje vývojářům práci tím, že jim poskytuje snadno použitelné vestavěné funkce pro získávání informací. Mohou použít metodu extractText() na objektu stránky k získání textového obsahu stránky.

Extrahujte text z PDF pomocí Pythonu

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

Generování dokumentů PDF prostřednictvím rozhraní Python API

Knihovna Python-PDFKit s otevřeným zdrojovým kódem usnadňuje vývojářům softwaru snadno vytvářet soubory PDF v aplikacích Python. Knihovna poskytuje podporu pro generování PDF z různých zdrojů. Knihovna umožňuje vývojářům softwaru vytvářet soubory PDF ze souborů HTML, řetězců nebo dokonce adres URL. V aplikacích Pythonu je také možné přidávat obrázky, záhlaví a zápatí, nastavovat velikost stránky, nastavovat okraje a tak dále. Následující příklad ukazuje, jak mohou vývojáři softwaru generovat soubory PDF z různých zdrojů pomocí několika řádků kódu Pythonu.

Vygenerujte PDF ze souboru HTML, řetězce nebo adresy URL prostřednictvím rozhraní Python API

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

Přizpůsobení generování PDF v aplikacích Python

Open source knihovna Python-PDFKit umožňuje vývojářům softwaru přizpůsobit proces generování PDF v rámci jejich vlastních aplikací. Vývojáři softwaru mohou specifikovat různé možnosti, jako je velikost stránky, okraje, záhlaví/zápatí, sloučení více dokumentů PDF a další. Tyto možnosti jsou předány do wkhtmltopdf jako argumenty příkazového řádku. Následující příklad ukazuje, jak mohou vývojáři softwaru přizpůsobit proces generování PDF v aplikacích Python.

Jak přizpůsobit proces generování PDF prostřednictvím rozhraní Python API?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

Převeďte HTML do PDF pomocí knihovny Python

Open source knihovna Python-PDFKit je velmi snadno použitelná knihovna pro načítání a převod dokumentů HTML na soubory PDF v jejich aplikacích Python. Kromě generování PDF může knihovna převádět obsah HTML do PDF přímo bez ukládání přechodného souboru. To může být užitečné při práci s dynamickým obsahem nebo při generování PDF za běhu. Níže je jednoduchý příklad, který ukazuje, jak mohou počítačoví programátoři převádět dokumenty HTML na soubory PDF v aplikacích Python.

 

Jak převést dokumenty HTML na soubory PDF pomocí Pythonu?

import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 Čeština