無料の Python API を介して PDF ドキュメントを生成および管理

PDF ファイルの作成とカスタマイズ、複数の PDF の結合、PDF からのテキスト抽出のためのオープンソース Python ライブラリ。 Wkhtmltopdf Python ラッパーを使用して HTML を PDF に変換します。

Python は、そのシンプルさと汎用性により、ソフトウェア開発者やデータサイエンティストにとって長年頼りになる言語です。 Python の多くの利点の 1 つは、さまざまなドメインをカバーするライブラリの豊富なエコシステムです。そのようなライブラリの 1 つが Python-PDFKit です。これは、Python で PDF を操作するための強力なツールです。 PDF を生成する必要がある場合でも、既存の PDF から情報を抽出する必要がある場合でも、HTML コンテンツを PDF に変換する必要がある場合でも、Python-PDFKit が対応します。このライブラリは非常に扱いやすく、ユーザーは HTML、URL、または生の HTML 文字列からシームレスに PDF を生成できます。

Python-PDFKit は、C++ で書かれた人気の PDF 変換ツール wkhtmltopdf の Python ラッパーです。このライブラリを使用すると、開発者は PDF の生成と操作を Python アプリケーションに簡単に統合できます。ライブラリには、HTML ファイルから PDF を作成する、URL から PDF を作成する、PDF 生成プロセスをカスタマイズする、HTML コンテンツを PDF に直接変換する、複数の PDF ドキュメントを 1 つのファイルに結合する、PDF ヒアリングを管理するなど、PDF ドキュメントを処理するための重要な機能がいくつかあります。 /フッター、PDF ページサイズの設定など。

Python-PDFKit ライブラリは、基礎となる wkhtmltopdf コマンドラインツールと対話するための直感的でわかりやすいインターフェイスを提供し、ソフトウェア開発者が PDF ドキュメントを簡単に作成、結合、変換できるようにします。多数の構成オプションにより、特定の要件に応じて PDF 出力を微調整できます。インストールプロセスが簡単で使い方も簡単な Python-PDFKit は、あらゆる開発者のツールキットに追加する価値があります。結論として、Python-PDFKit は、PDF 生成タスクを効率化し、プロ並みのドキュメントを簡単に作成したいと考えている Python 開発者にとって、必ず試してほしいライブラリです。

概要

Python-PDFKit の機能の概要。

機能の概要

PDF を作成する
PDF をトリミング
HTML を PDF に変換
PDF を分割する
PDF を結合
ハイパーリンクの埋め込み
サークルを挿入
カスタムデータを追加する
図形を追加する
Unicode のサポート
フォントの埋め込み
PDF を暗号化する
画像の埋め込み
パスワードを追加する
メタデータ

Python-PDFKit

Python-PDFKit は、PDF ファイル形式とエクスポート用の業界標準形式をサポートしています。

読者

ライター

TXT, HTML

Python-PDFKit

プラットフォームの独立性

Python-PDFKit は Python 2.6 以降でテストされています。

Python 2.6 以降

Python-PDFKit

Python-PDFKit 入門

Python-PDFKit をインストールするための推奨される最も簡単な方法は、pip を使用することです。スムーズにインストールするには、次のコマンドを使用してください。

pip 経由で Python-PDFKit をインストールする

 pip install pdfkit

手動でインストールすることもできます。最新のリリースファイルを GitHub リポジトリから直接ダウンロードします。

Python 経由で PDF からテキストを抽出する

Python-PDFKit ライブラリは、Python を介して PDF ファイルからプログラムでテキストを抽出する機能を提供します。 PDF ファイルからデータを取得するのは簡単ではありません。これは、PDF が情報を保存する方法がその実現を難しくしているためです。 Python-PDFKit は、情報を取得するための使いやすい組み込み関数を提供することで、開発者の仕事を容易にします。ページオブジェクトの extractText() メソッドを使用して、ページのテキストコンテンツを取得できます。

Python 経由で PDF からテキストを抽出する

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text())

Python API を使用した PDF ドキュメントの生成

オープンソースの Python-PDFKit ライブラリを使用すると、ソフトウェア開発者は Python アプリケーション内で PDF ファイルを簡単に生成できます。このライブラリは、さまざまなソースから PDF を生成するためのサポートを提供しています。このライブラリを使用すると、ソフトウェア開発者は HTML ファイル、文字列、さらには URL から PDF を作成できます。 Python アプリケーション内で画像、ヘッダーとフッターの追加、ページサイズの設定、余白の設定などを行うこともできます。次の例は、ソフトウェア開発者がわずか数行の Python コードを使用して、さまざまなソースから PDF ファイルを生成する方法を示しています。

Python API 経由で HTML ファイル、文字列、または URL から PDF を生成する

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!"
pdfkit.from_string(html_string, "output.pdf")

# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")

Python アプリ内での PDF 生成のカスタマイズ

オープンソースの Python-PDFKit ライブラリを使用すると、ソフトウェア開発者は独自のアプリケーション内で PDF 生成プロセスをカスタマイズできます。ソフトウェア開発者は、ページサイズ、余白、ヘッダー/フッター、複数の PDF ドキュメントの結合など、さまざまなオプションを指定できます。これらのオプションは、コマンドライン引数として wkhtmltopdf に渡されます。次の例は、ソフトウェア開発者が Python アプリケーション内で PDF 生成プロセスをカスタマイズする方法を示しています。

Python API 経由で PDF 生成プロセスをカスタマイズする方法

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

Python ライブラリ経由で HTML を PDF に変換

オープンソースの Python-PDFKit ライブラリは、Python アプリケーション内で HTML ドキュメントをロードして PDF ファイルに変換するための非常に使いやすいライブラリです。このライブラリでは、PDF を生成するだけでなく、中間ファイルを保存せずに HTML コンテンツを PDF に直接変換できます。これは、動的コンテンツを処理する場合や、PDF をオンザフライで生成する場合に役立ちます。以下は、コンピュータープログラマーが Python アプリケーション内で HTML ドキュメントを PDF ファイルに変換する方法を示す簡単な例です。

Python 経由で HTML ドキュメントを PDF ファイルに変換する方法

import pdfkit

html_string = "Hello, PDFKit!"
pdf_bytes = pdfkit.from_string(html_string, False)

# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
    f.write(pdf_bytes)