1. Товары
  2.   PDF
  3.   Python
  4.   Python-PDFKit
 
  

Создавайте PDF-документы и управляйте ими с помощью бесплатного API Python

Библиотека Python с открытым исходным кодом для создания и настройки PDF-файлов, объединения нескольких PDF-файлов и извлечения текста из PDF. Он использует Wkhtmltopdf Python Wrapper для преобразования HTML в PDF.

Python уже давно стал популярным языком среди разработчиков программного обеспечения и специалистов по обработке данных благодаря своей простоте и универсальности. Одним из многих преимуществ Python является его богатая экосистема библиотек, охватывающих различные области. Одной из таких библиотек является Python-PDFKit, мощный инструмент для работы с PDF-файлами в Python. Если вам нужно создать PDF-файлы, извлечь информацию из существующих или даже преобразовать HTML-контент в PDF, Python-PDFKit поможет вам. Библиотека очень проста в использовании и позволяет пользователям легко создавать PDF-файлы из HTML, URL-адресов или необработанных строк HTML.

Python-PDFKit — это оболочка Python для популярного инструмента преобразования PDF-файлов wkhtmltopdf, написанного на C++. С помощью этой библиотеки разработчики могут легко интегрировать создание и обработку PDF-файлов в свои приложения Python. В библиотеке есть несколько важных функций для обработки PDF-документов путем создания PDF-файлов из файлов HTML, создания PDF-файлов из URL-адресов, настройки процесса создания PDF-файлов, прямого преобразования HTML-содержимого в PDF, объединения нескольких PDF-документов в один файл, управления PDF-файлами. /footers, настройка размера страницы PDF и многое другое.

Библиотека Python-PDFKit предоставляет интуитивно понятный и простой интерфейс для взаимодействия с базовым инструментом командной строки wkhtmltopdf, что позволяет разработчикам программного обеспечения легко создавать, объединять и конвертировать PDF-документы. Его многочисленные параметры конфигурации позволяют точно настроить вывод PDF в соответствии с конкретными требованиями. Благодаря простому процессу установки и простому использованию Python-PDFKit является ценным дополнением к набору инструментов любого разработчика. В заключение отметим, что Python-PDFKit — это обязательная библиотека для любого разработчика Python, который хочет упростить задачи создания PDF-файлов и с легкостью создавать документы профессионального качества.

Previous Next

Начало работы с Python-PDFKit

Рекомендуемый и самый простой способ установить Python-PDFKit — использовать pip. Пожалуйста, используйте следующую команду для плавной установки.

Установите Python-PDFKit через pip

 pip install pdfkit 

Вы также можете установить его вручную; загрузите файлы последней версии непосредственно из репозитория GitHub.

Извлечение текста из PDF с помощью Python

Библиотека Python-PDFKit предоставляет возможность программного извлечения текста из файлов PDF с помощью Python. Извлечь данные из PDF-файла нелегко, потому что способ хранения информации в PDF просто усложняет эту задачу. Python-PDFKit упрощает работу разработчиков, предоставляя им простые в использовании встроенные функции для получения информации. Они могут использовать метод extractText() объекта страницы, чтобы получить текстовое содержимое страницы.

Извлечение текста из PDF с помощью Python

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

Создание PDF-документов с помощью Python API

Библиотека Python-PDFKit с открытым исходным кодом позволяет разработчикам программного обеспечения легко создавать PDF-файлы в своих приложениях Python. Библиотека обеспечила поддержку создания PDF-файлов из различных источников. Библиотека позволяет разработчикам программного обеспечения создавать PDF-файлы из файлов HTML, строк или даже URL-адресов. Внутри приложений Python также можно добавлять изображения, верхние и нижние колонтитулы, устанавливать размер страницы, устанавливать поля и т. д. В следующем примере показано, как разработчики программного обеспечения могут создавать PDF-файлы из различных источников с помощью всего лишь пары строк кода Python.

Создать PDF-файл из HTML-файла, строки или URL-адреса с помощью Python API

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

Настройка создания PDF-файлов в приложениях Python

Библиотека Python-PDFKit с открытым исходным кодом позволяет разработчикам программного обеспечения настраивать процесс создания PDF-файлов в своих собственных приложениях. Разработчики программного обеспечения могут указывать различные параметры, такие как размер страницы, поля, верхние и нижние колонтитулы, объединение нескольких документов PDF и многое другое. Эти параметры передаются в wkhtmltopdf в качестве аргументов командной строки. В следующем примере показано, как разработчики программного обеспечения могут настроить процесс создания PDF-файлов в приложениях Python.

Как настроить процесс создания PDF-файлов с помощью Python API?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

Преобразование HTML в PDF с помощью библиотеки Python

Библиотека Python-PDFKit с открытым исходным кодом — это очень простая в использовании библиотека для загрузки и преобразования HTML-документов в файлы PDF внутри приложений Python. Помимо создания PDF-файлов, библиотека может напрямую конвертировать HTML-контент в PDF без сохранения промежуточного файла. Это может быть полезно при работе с динамическим контентом или оперативном создании PDF-файлов. Ниже приведен простой пример, показывающий, как программисты могут конвертировать документы HTML в файлы PDF внутри приложений Python.

 

Как конвертировать HTML-документы в PDF-файлы с помощью Python?

import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 Русский