Генерирайте и управлявайте PDF документи чрез безплатен API на Python

Python библиотека с отворен код за създаване и персонализиране на PDF файлове, обединяване на множество PDF файлове и извличане на текст от PDF. Той използва Wkhtmltopdf Python Wrapper за конвертиране на HTML в PDF.

Python отдавна е предпочитан език за разработчиците на софтуер и специалистите по данни поради своята простота и гъвкавост. Едно от многото предимства на Python е неговата богата екосистема от библиотеки, които покриват различни домейни. Една такава библиотека е Python-PDFKit, мощен инструмент за манипулиране на PDF в Python. Независимо дали трябва да генерирате PDF файлове, да извличате информация от съществуващи или дори да конвертирате HTML съдържание в PDF, Python-PDFKit ви покрива. Библиотеката е много лесна за работа и позволява на потребителите безпроблемно да генерират PDF файлове от HTML, URL или необработени HTML низове.

Python-PDFKit е обвивка на Python за популярния инструмент за конвертиране на PDF, wkhtmltopdf, който е написан на C++. С тази библиотека разработчиците могат лесно да интегрират генерирането и манипулирането на PDF в своите Python приложения. Има няколко важни функции част от библиотеката за работа с PDF документи чрез създаване на PDF файлове от HTML файлове, създаване на PDF файлове от URL адреси, персонализиране на процеса на генериране на PDF, конвертиране на HTML съдържание в PDF директно, обединяване на множество PDF документи в един файл, управление на PDF чува /footers, задаване на размера на PDF страницата и много други.

Библиотеката Python-PDFKit предоставя интуитивен и лесен интерфейс за взаимодействие с основния инструмент за команден ред wkhtmltopdf, което позволява на разработчиците на софтуер да създават, обединяват и конвертират PDF документи без усилие. Неговите многобройни опции за конфигуриране позволяват фина настройка на PDF изхода според специфични изисквания. Със своя лесен процес на инсталиране и лесна употреба, Python-PDFKit е ценно допълнение към инструментариума на всеки разработчик. В заключение, Python-PDFKit е задължителна библиотека за всеки разработчик на Python, който иска да рационализира задачите за генериране на PDF и да създава професионално изглеждащи документи с лекота.

С един поглед

Общ преглед на функциите на Python-PDFKit.

Преглед на характеристиките

Създайте PDF
Изрязване на PDF
Конвертирайте HTML в PDF
Разделяне на PDF файлове
Обединяване на PDF файлове
Вграждане на хипервръзки
Вмъкване на кръгове
Добавете персонализирани данни
Добавяне на форми
Поддръжка на Unicode
Вграждане на шрифт
Шифроване на PDF
Вграждане на изображения
Добавете пароли
Метаданни

Python-PDFKit

Python-PDFKit поддържа PDF файлов формат, както и индустриални стандартни формати за експортиране.

Читател

Writer

TXT, HTML

Python-PDFKit

Независимост на платформата

Python-PDFKit е тестван с Python 2.6 и по-нова версия.

Python 2.6 и по-нова версия

Python-PDFKit

Първи стъпки с Python-PDFKit

Препоръчителният и най-лесният начин за инсталиране на Python-PDFKit е използването на pip. Моля, използвайте следната команда за гладка инсталация.

Инсталирайте Python-PDFKit чрез pip

 pip install pdfkit

Можете също да го инсталирате ръчно; изтеглете файловете с най-новата версия директно от хранилището на GitHub.

Извличане на текст от PDF чрез Python

Библиотеката Python-PDFKit предоставя възможност за програмно извличане на текст от PDF файлове чрез Python. Не е лесно да извлечете данни от PDF файл, защото начинът, по който PDF съхранява информацията, просто затруднява постигането му. Python-PDFKit улеснява работата на разработчиците, като им предоставя лесни за използване вградени функции за извличане на информация. Те могат да използват метода extractText() на обекта на страницата, за да получат текстовото съдържание на страницата.

Извличане на текст от PDF чрез Python

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text())

Генериране на PDF документи чрез API на Python

Библиотеката Python-PDFKit с отворен код улеснява разработчиците на софтуер да генерират PDF файл с лекота в своите Python приложения. Библиотеката е предоставила поддръжка за генериране на PDF файлове от различни източници. Библиотеката позволява на разработчиците на софтуер да създават PDF файлове от HTML файлове, низове или дори URL адреси. Също така е възможно да добавяте изображения, горни и долни колонтитули, да задавате размер на страницата, да задавате полета и така нататък в приложенията на Python. Следващият пример демонстрира как разработчиците на софтуер могат да генерират PDF файлове от различни източници само с няколко реда Python код.

Генерирайте PDF от HTML файл, низ или URL чрез API на Python

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!"
pdfkit.from_string(html_string, "output.pdf")

# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")

Персонализиране на генерирането на PDF в приложенията на Python

Библиотеката Python-PDFKit с отворен код позволява на разработчиците на софтуер да персонализират процеса на генериране на PDF в собствените си приложения. Разработчиците на софтуер могат да определят различни опции като размер на страницата, полета, горни/долни колонтитули, обединяване на множество PDF документи и др. Тези опции се предават на wkhtmltopdf като аргументи на командния ред. Следващият пример показва как разработчиците на софтуер могат да персонализират процеса на генериране на PDF в приложения на Python.

Как да персонализирате процеса на генериране на PDF чрез API на Python?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

Конвертиране на HTML в PDF чрез библиотека на Python

Библиотеката Python-PDFKit с отворен код е много лесна за използване библиотека за зареждане и конвертиране на HTML документи в PDF файлове в техните Python приложения. Освен генерирането на PDF файлове, библиотеката може да конвертира HTML съдържание в PDF директно, без да записва междинен файл. Това може да бъде полезно, когато работите с динамично съдържание или генерирате PDF файлове в движение. По-долу е даден прост пример, който показва как компютърните програмисти могат да конвертират HTML документи в PDF файлове в приложения на Python.

Как да конвертирате HTML документи в PDF файлове чрез Python?

import pdfkit

html_string = "Hello, PDFKit!"
pdf_bytes = pdfkit.from_string(html_string, False)

# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
    f.write(pdf_bytes)