اسناد PDF را از طریق API رایگان Python ایجاد و مدیریت کنید
کتابخانه Python منبع باز برای ایجاد و سفارشی کردن فایل های PDF، ادغام چندین PDF و استخراج متن از PDF. از Wkhtmltopdf Python Wrapper برای تبدیل HTML به PDF استفاده می کند.
Python به دلیل سادگی و تطبیق پذیری، مدت هاست که زبان مورد استفاده توسعه دهندگان نرم افزار و دانشمندان داده بوده است. یکی از مزایای متعدد پایتون، اکوسیستم غنی کتابخانههای آن است که حوزههای مختلف را پوشش میدهد. یکی از این کتابخانه ها Python-PDFKit است که ابزاری قدرتمند برای دستکاری PDF در پایتون است. چه نیاز به تولید فایلهای PDF، استخراج اطلاعات از فایلهای موجود یا حتی تبدیل محتوای HTML به PDF داشته باشید، Python-PDFKit شما را تحت پوشش قرار میدهد. مدیریت این کتابخانه بسیار آسان است و کاربران را قادر میسازد تا فایلهای PDF را از HTML، URL، یا رشتههای HTML خام بهطور یکپارچه تولید کنند.
Python-PDFKit یک پوشش پایتون برای ابزار محبوب تبدیل PDF، wkhtmltopdf است که به زبان C++ نوشته شده است. با استفاده از این کتابخانه، توسعه دهندگان می توانند به راحتی تولید و دستکاری PDF را در برنامه های پایتون خود ادغام کنند. چندین ویژگی مهم در کتابخانه برای مدیریت اسناد PDF از طریق ایجاد PDF از فایل های HTML، ایجاد PDF از URL ها، سفارشی سازی فرآیند تولید PDF، تبدیل مستقیم محتوای HTML به PDF، ادغام چندین سند PDF در یک فایل واحد، مدیریت فایل های PDF وجود دارد. /footers، تنظیم اندازه صفحه PDF و بسیاری موارد دیگر.
کتابخانه Python-PDFKit یک رابط بصری و ساده برای تعامل با ابزار خط فرمان زیربنایی wkhtmltopdf فراهم میکند و توسعهدهندگان نرمافزار را قادر میسازد تا اسناد PDF را بدون زحمت ایجاد، ادغام و تبدیل کنند. گزینه های پیکربندی متعدد آن امکان تنظیم دقیق خروجی PDF را با توجه به نیازهای خاص فراهم می کند. Python-PDFKit با فرآیند نصب آسان و استفاده آسان، افزودنی ارزشمند به جعبه ابزار هر توسعه دهنده است. در پایان، Python-PDFKit یک کتابخانه ضروری برای هر توسعهدهنده پایتون است که به دنبال سادهسازی وظایف تولید PDF و تولید اسناد حرفهای به آسانی است.
شروع به کار با Python-PDFKit
توصیه شده و ساده ترین راه برای نصب Python-PDFKit استفاده از pip است. لطفاً از دستور زیر برای نصب روان استفاده کنید.
Python-PDFKit را از طریق پیپ نصب کنید
pip install pdfkit
همچنین می توانید آن را به صورت دستی نصب کنید. آخرین فایل های نسخه را مستقیماً از مخزن GitHub دانلود کنید.
متن را از PDF از طریق پایتون استخراج کنید
کتابخانه Python-PDFKit قابلیت استخراج برنامهای متن از فایلهای PDF از طریق پایتون را فراهم میکند. بازیابی داده ها از یک فایل PDF کار آسانی نیست زیرا نحوه ذخیره سازی اطلاعات PDF فقط دستیابی به آن را دشوار می کند. Python-PDFKit با ارائه آسان توابع داخلی برای بازیابی اطلاعات، کار توسعه دهندگان را آسان می کند. آنها می توانند از متد ()extractText در شی صفحه برای دریافت محتوای متنی صفحه استفاده کنند.
متن را از PDF از طریق پایتون استخراج کنید
// extract text from a PDF
from Python-PDFKit import PdfReader
reader = PdfReader("example.pdf")
page = reader.pages[0]
print(page.extract_text())
ایجاد اسناد PDF از طریق Python API
کتابخانه منبع باز Python-PDFKit این امکان را برای توسعه دهندگان نرم افزار فراهم می کند تا به راحتی فایل PDF را در برنامه های پایتون خود تولید کنند. این کتابخانه برای تولید PDF از منابع مختلف پشتیبانی ارائه کرده است. این کتابخانه به توسعه دهندگان نرم افزار اجازه می دهد تا فایل های PDF را از فایل های HTML، رشته ها یا حتی URL ها ایجاد کنند. همچنین امکان افزودن تصاویر، سرصفحه ها و پاورقی ها، تنظیم اندازه صفحه، تنظیم حاشیه و غیره در برنامه های پایتون وجود دارد. مثال زیر نشان می دهد که چگونه توسعه دهندگان نرم افزار می توانند فایل های PDF را از منابع مختلف تنها با چند خط کد پایتون تولید کنند.
یک PDF از یک فایل HTML، رشته یا URL از طریق Python API تولید کنید
import pdfkit
# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")
# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!
"
pdfkit.from_string(html_string, "output.pdf")
# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")
سفارشی کردن تولید PDF در برنامه های پایتون
کتابخانه منبع باز Python-PDFKit به توسعه دهندگان نرم افزار امکان می دهد تا فرآیند تولید PDF را در برنامه های خود سفارشی کنند. توسعهدهندگان نرمافزار میتوانند گزینههای مختلفی مانند اندازه صفحه، حاشیهها، سرصفحهها/پانویسها، ادغام چندین سند PDF و موارد دیگر را مشخص کنند. این گزینه ها به عنوان آرگومان های خط فرمان به wkhtmltopdf منتقل می شوند. مثال زیر نشان می دهد که چگونه توسعه دهندگان نرم افزار می توانند فرآیند تولید PDF را در برنامه های پایتون سفارشی کنند.
چگونه فرآیند تولید PDF را از طریق Python API سفارشی کنیم؟
import pdfkit
options = {
'page-size': 'A4',
'margin-top': '0mm',
'margin-right': '0mm',
'margin-bottom': '0mm',
'margin-left': '0mm',
}
pdfkit.from_file("source.html", "output.pdf", options=options)
تبدیل HTML به PDF از طریق کتابخانه Python
کتابخانه منبع باز Python-PDFKit یک کتابخانه بسیار آسان برای بارگیری و تبدیل اسناد HTML به فایل های PDF در داخل برنامه های پایتون آنها است. علاوه بر تولید PDF، این کتابخانه میتواند محتوای HTML را مستقیماً بدون ذخیره یک فایل میانی به PDF تبدیل کند. این می تواند هنگام برخورد با محتوای پویا یا تولید فایل های PDF در لحظه مفید باشد. در زیر یک مثال ساده است که نشان می دهد چگونه برنامه نویسان کامپیوتر می توانند اسناد HTML را به فایل های PDF داخل برنامه های پایتون تبدیل کنند.
چگونه اسناد HTML را از طریق پایتون به فایلهای PDF تبدیل کنیم؟
import pdfkit
html_string = "Hello, PDFKit!
"
pdf_bytes = pdfkit.from_string(html_string, False)
# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
f.write(pdf_bytes)