1. 产品
  2.   PDF格式
  3.   Python
  4.   Python-PDFKit
 
  

通过免费的 Python API 生成和管理 PDF 文档

用于创建和自定义 PDF 文件、合并多个 PDF 以及从 PDF 中提取文本的开源 Python 库。 它使用 Wkhtmltopdf Python 包装器将 HTML 转换为 PDF。

由于其简单性和多功能性,Python 长期以来一直是软件开发人员和数据科学家的首选语言。 Python 的众多优势之一是其丰富的库生态系统,涵盖各个领域。 Python-PDFKit 就是这样一个库,它是 Python 中用于 PDF 操作的强大工具。 无论您需要生成 PDF、从现有 PDF 中提取信息,还是将 HTML 内容转换为 PDF,Python-PDFKit 都能满足您的需求。 该库非常易于操作,使用户能够从 HTML、URL 或原始 HTML 字符串无缝生成 PDF。

Python-PDFKit 是流行的 PDF 转换工具 wkhtmltopdf 的 Python 包装器,它是用 C++ 编写的。 借助该库,开发人员可以轻松地将 PDF 生成和操作集成到他们的 Python 应用程序中。 该库有几个重要功能用于处理 PDF 文档,包括从 HTML 文件创建 PDF、从 URL 创建 PDF、自定义 PDF 生成过程、直接将 HTML 内容转换为 PDF、将多个 PDF 文档合并到单个文件、管理 PDF 文档 /footers,设置 PDF 页面大小等等。

Python-PDFKit 库提供了一个直观、简单的界面来与底层 wkhtmltopdf 命令行工具交互,使软件开发人员能够轻松创建、合并和转换 PDF 文档。 其众多的配置选项可以根据特定要求微调 PDF 输出。 凭借其简单的安装过程和简单的使用,Python-PDFKit 成为任何开发人员工具包的宝贵补充。 总之,对于任何希望简化 PDF 生成任务并轻松生成具有专业外观的文档的 Python 开发人员来说,Python-PDFKit 是一个必须尝试的库。

Previous Next

Python-PDFKit 入门

安装 Python-PDFKit 的推荐且最简单的方法是使用 pip。 请使用以下命令顺利安装。

通过 pip 安装 Python-PDFKit

 pip install pdfkit 

您也可以手动安装; 直接从 GitHub 存储库下载最新版本文件。

通过 Python 从 PDF 中提取文本

Python-PDFKit 库提供了通过 Python 以编程方式从 PDF 文件中提取文本的功能。 从 PDF 文件中检索数据并不容易,因为 PDF 存储信息的方式使其难以实现。 Python-PDFKit 为开发人员提供易于使用的内置函数来检索信息,从而使他们的工作变得轻松。 他们可以使用页面对象上的 extractText() 方法来获取页面的文本内容。

s

通过 Python 从 PDF 中提取文本

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

通过Python API生成PDF文档

开源 Python-PDFKit 库使软件开发人员可以轻松地在其 Python 应用程序中生成 PDF 文件。 该库提供了从各种来源生成 PDF 的支持。 该库允许软件开发人员从 HTML 文件、字符串甚至 URL 创建 PDF。 还可以在 Python 应用程序中添加图像、页眉和页脚、设置页面大小、设置边距等。 以下示例演示了软件开发人员如何使用几行 Python 代码从各种来源生成 PDF 文件。

通过 Python API 从 HTML 文件、字符串或 URL 生成 PDF

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

在 Python 应用程序中自定义 PDF 生成

开源 Python-PDFKit 库使软件开发人员能够在自己的应用程序中自定义 PDF 生成过程。 软件开发人员可以指定各种选项,例如页面大小、边距、页眉/页脚、合并多个 PDF 文档等等。 这些选项作为命令行参数传递给 wkhtmltopdf。 以下示例展示了软件开发人员如何在 Python 应用程序中自定义 PDF 生成过程。

如何通过Python API自定义PDF生成过程?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

通过 Python 库将 HTML 转换为 PDF

开源 Python-PDFKit 库是一个非常易于使用的库,用于在 Python 应用程序中加载 HTML 文档并将其转换为 PDF 文件。 除了生成 PDF 之外,该库还可以直接将 HTML 内容转换为 PDF,而无需保存中间文件。 这在处理动态内容或即时生成 PDF 时非常有用。 下面是一个简单的示例,展示了计算机程序员如何在 Python 应用程序中将 HTML 文档转换为 PDF 文件。

 

如何通过Python将HTML文档转换为PDF文件?

s
import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 中国人