Генерирайте и управлявайте PDF документи чрез безплатен API на Python
Python библиотека с отворен код за създаване и персонализиране на PDF файлове, обединяване на множество PDF файлове и извличане на текст от PDF. Той използва Wkhtmltopdf Python Wrapper за конвертиране на HTML в PDF.
Python отдавна е предпочитан език за разработчиците на софтуер и специалистите по данни поради своята простота и гъвкавост. Едно от многото предимства на Python е неговата богата екосистема от библиотеки, които покриват различни домейни. Една такава библиотека е Python-PDFKit, мощен инструмент за манипулиране на PDF в Python. Независимо дали трябва да генерирате PDF файлове, да извличате информация от съществуващи или дори да конвертирате HTML съдържание в PDF, Python-PDFKit ви покрива. Библиотеката е много лесна за работа и позволява на потребителите безпроблемно да генерират PDF файлове от HTML, URL или необработени HTML низове.
Python-PDFKit е обвивка на Python за популярния инструмент за конвертиране на PDF, wkhtmltopdf, който е написан на C++. С тази библиотека разработчиците могат лесно да интегрират генерирането и манипулирането на PDF в своите Python приложения. Има няколко важни функции част от библиотеката за работа с PDF документи чрез създаване на PDF файлове от HTML файлове, създаване на PDF файлове от URL адреси, персонализиране на процеса на генериране на PDF, конвертиране на HTML съдържание в PDF директно, обединяване на множество PDF документи в един файл, управление на PDF чува /footers, задаване на размера на PDF страницата и много други.
Библиотеката Python-PDFKit предоставя интуитивен и лесен интерфейс за взаимодействие с основния инструмент за команден ред wkhtmltopdf, което позволява на разработчиците на софтуер да създават, обединяват и конвертират PDF документи без усилие. Неговите многобройни опции за конфигуриране позволяват фина настройка на PDF изхода според специфични изисквания. Със своя лесен процес на инсталиране и лесна употреба, Python-PDFKit е ценно допълнение към инструментариума на всеки разработчик. В заключение, Python-PDFKit е задължителна библиотека за всеки разработчик на Python, който иска да рационализира задачите за генериране на PDF и да създава професионално изглеждащи документи с лекота.
Първи стъпки с Python-PDFKit
Препоръчителният и най-лесният начин за инсталиране на Python-PDFKit е използването на pip. Моля, използвайте следната команда за гладка инсталация.
Инсталирайте Python-PDFKit чрез pip
pip install pdfkit
Можете също да го инсталирате ръчно; изтеглете файловете с най-новата версия директно от хранилището на GitHub.
Извличане на текст от PDF чрез Python
Библиотеката Python-PDFKit предоставя възможност за програмно извличане на текст от PDF файлове чрез Python. Не е лесно да извлечете данни от PDF файл, защото начинът, по който PDF съхранява информацията, просто затруднява постигането му. Python-PDFKit улеснява работата на разработчиците, като им предоставя лесни за използване вградени функции за извличане на информация. Те могат да използват метода extractText() на обекта на страницата, за да получат текстовото съдържание на страницата.
Извличане на текст от PDF чрез Python
// extract text from a PDF
from Python-PDFKit import PdfReader
reader = PdfReader("example.pdf")
page = reader.pages[0]
print(page.extract_text())
Генериране на PDF документи чрез API на Python
Библиотеката Python-PDFKit с отворен код улеснява разработчиците на софтуер да генерират PDF файл с лекота в своите Python приложения. Библиотеката е предоставила поддръжка за генериране на PDF файлове от различни източници. Библиотеката позволява на разработчиците на софтуер да създават PDF файлове от HTML файлове, низове или дори URL адреси. Също така е възможно да добавяте изображения, горни и долни колонтитули, да задавате размер на страницата, да задавате полета и така нататък в приложенията на Python. Следващият пример демонстрира как разработчиците на софтуер могат да генерират PDF файлове от различни източници само с няколко реда Python код.
Генерирайте PDF от HTML файл, низ или URL чрез API на Python
import pdfkit
# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")
# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!
"
pdfkit.from_string(html_string, "output.pdf")
# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")
Персонализиране на генерирането на PDF в приложенията на Python
Библиотеката Python-PDFKit с отворен код позволява на разработчиците на софтуер да персонализират процеса на генериране на PDF в собствените си приложения. Разработчиците на софтуер могат да определят различни опции като размер на страницата, полета, горни/долни колонтитули, обединяване на множество PDF документи и др. Тези опции се предават на wkhtmltopdf като аргументи на командния ред. Следващият пример показва как разработчиците на софтуер могат да персонализират процеса на генериране на PDF в приложения на Python.
Как да персонализирате процеса на генериране на PDF чрез API на Python?
import pdfkit
options = {
'page-size': 'A4',
'margin-top': '0mm',
'margin-right': '0mm',
'margin-bottom': '0mm',
'margin-left': '0mm',
}
pdfkit.from_file("source.html", "output.pdf", options=options)
Конвертиране на HTML в PDF чрез библиотека на Python
Библиотеката Python-PDFKit с отворен код е много лесна за използване библиотека за зареждане и конвертиране на HTML документи в PDF файлове в техните Python приложения. Освен генерирането на PDF файлове, библиотеката може да конвертира HTML съдържание в PDF директно, без да записва междинен файл. Това може да бъде полезно, когато работите с динамично съдържание или генерирате PDF файлове в движение. По-долу е даден прост пример, който показва как компютърните програмисти могат да конвертират HTML документи в PDF файлове в приложения на Python.
Как да конвертирате HTML документи в PDF файлове чрез Python?
import pdfkit
html_string = "Hello, PDFKit!
"
pdf_bytes = pdfkit.from_string(html_string, False)
# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
f.write(pdf_bytes)