1. Продукти
  2.   PDF
  3.   Python
  4.   Python-PDFKit
 
  

Створюйте PDF-документи та керуйте ними за допомогою безкоштовного API Python

Бібліотека Python з відкритим кодом для створення та налаштування PDF-файлів, об’єднання кількох PDF-файлів і вилучення тексту з PDF-файлів. Він використовує Wkhtmltopdf Python Wrapper для перетворення HTML у PDF.

Python уже давно є популярною мовою для розробників програмного забезпечення та дослідників даних завдяки своїй простоті та універсальності. Однією з багатьох переваг Python є його багата екосистема бібліотек, які охоплюють різні домени. Однією з таких бібліотек є Python-PDFKit, потужний інструмент для роботи з PDF-файлами на Python. Незалежно від того, чи потрібно вам створювати PDF-файли, витягувати інформацію з існуючих або навіть перетворювати вміст HTML у PDF, Python-PDFKit допоможе вам. Бібліотека дуже проста у використанні та дозволяє користувачам легко створювати PDF-файли з HTML, URL-адреси або необроблених рядків HTML.

Python-PDFKit — це оболонка Python для популярного інструменту перетворення PDF wkhtmltopdf, написаного мовою C++. За допомогою цієї бібліотеки розробники можуть легко інтегрувати створення PDF-файлів і маніпуляції з ними у свої програми Python. Бібліотека містить кілька важливих функцій для роботи з PDF-документами: створювати PDF-файли з HTML-файлів, створювати PDF-файли з URL-адрес, налаштовувати процес створення PDF-файлів, безпосередньо перетворювати HTML-вміст у PDF, об’єднувати кілька PDF-документів в один файл, керувати файлами PDF /footers, встановлення розміру сторінки PDF та багато іншого.

Бібліотека Python-PDFKit надає інтуїтивно зрозумілий і простий інтерфейс для взаємодії з базовим інструментом командного рядка wkhtmltopdf, дозволяючи розробникам програмного забезпечення створювати, об’єднувати та конвертувати PDF-документи без зусиль. Його численні параметри конфігурації дозволяють точно налаштувати PDF-файл відповідно до конкретних вимог. Завдяки легкому процесу встановлення та простому використанню Python-PDFKit є цінним доповненням до інструментарію будь-якого розробника. Підсумовуючи, Python-PDFKit — це бібліотека, яку варто спробувати будь-якому розробнику Python, який хоче спростити завдання створення PDF-файлів і з легкістю створювати документи професійного вигляду.

Previous Next

Початок роботи з Python-PDFKit

Рекомендований і найпростіший спосіб інсталювати Python-PDFKit — використовувати pip. Скористайтеся наступною командою для плавного встановлення.

Установіть Python-PDFKit  через pip

 pip install pdfkit 

Ви також можете встановити його вручну; завантажте файли останнього випуску безпосередньо зі сховища GitHub.

Вилучення тексту з PDF за допомогою Python

Бібліотека Python-PDFKit надає можливість програмного вилучення тексту з PDF-файлів за допомогою Python. Отримати дані з PDF-файлу нелегко, оскільки спосіб зберігання інформації у PDF лише ускладнює це. Python-PDFKit полегшує роботу розробників, надаючи їм прості у використанні вбудовані функції для отримання інформації. Вони можуть використовувати метод extractText() для об’єкта сторінки, щоб отримати текстовий вміст сторінки.

Витягніть текст з PDF за допомогою Python

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

Створення PDF-документів через API Python

Бібліотека Python-PDFKit з відкритим вихідним кодом дозволяє розробникам програмного забезпечення легко генерувати PDF-файл у своїх програмах Python. Бібліотека надала підтримку для створення PDF-файлів із різних джерел. Бібліотека дозволяє розробникам програмного забезпечення створювати PDF-файли з файлів HTML, рядків або навіть URL-адрес. Також можна додавати зображення, верхні та нижні колонтитули, установлювати розмір сторінки, встановлювати поля тощо в програмах Python. Наступний приклад демонструє, як розробники програмного забезпечення можуть генерувати PDF-файли з різних джерел лише за допомогою кількох рядків коду Python.

Створення PDF-файлу з HTML-файлу, рядка або URL-адреси за допомогою Python API

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

Налаштування генерації PDF у програмах Python

Бібліотека Python-PDFKit з відкритим вихідним кодом дозволяє розробникам програмного забезпечення налаштовувати процес генерування PDF-файлів у власних програмах. Розробники програмного забезпечення можуть вказати різні параметри, такі як розмір сторінки, поля, верхні та нижні колонтитули, об’єднання кількох документів PDF тощо. Ці параметри передаються до wkhtmltopdf як аргументи командного рядка. У наступному прикладі показано, як розробники програмного забезпечення можуть налаштувати процес створення PDF-файлів у програмах Python.

Як налаштувати процес генерації PDF за допомогою Python API?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

Перетворення HTML на PDF за допомогою бібліотеки Python

Бібліотека Python-PDFKit з відкритим вихідним кодом — це дуже проста у використанні бібліотека для завантаження та перетворення документів HTML у файли PDF у їхніх програмах Python. Окрім створення PDF-файлів, бібліотека може конвертувати вміст HTML у PDF безпосередньо без збереження проміжного файлу. Це може бути корисно під час роботи з динамічним вмістом або створення PDF-файлів на льоту. Нижче наведено простий приклад, який показує, як комп’ютерні програмісти можуть перетворювати документи HTML у файли PDF у програмах Python.

 

Як конвертувати документи HTML у файли PDF за допомогою Python?

import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 Українська