1. محصولات
  2.   PDF
  3.   Python
  4.   Python-PDFKit
 
  

اسناد PDF را از طریق API رایگان Python ایجاد و مدیریت کنید

کتابخانه Python منبع باز برای ایجاد و سفارشی کردن فایل های PDF، ادغام چندین PDF و استخراج متن از PDF. از Wkhtmltopdf Python Wrapper برای تبدیل HTML به PDF استفاده می کند.

Python به دلیل سادگی و تطبیق پذیری، مدت هاست که زبان مورد استفاده توسعه دهندگان نرم افزار و دانشمندان داده بوده است. یکی از مزایای متعدد پایتون، اکوسیستم غنی کتابخانه‌های آن است که حوزه‌های مختلف را پوشش می‌دهد. یکی از این کتابخانه ها Python-PDFKit است که ابزاری قدرتمند برای دستکاری PDF در پایتون است. چه نیاز به تولید فایل‌های PDF، استخراج اطلاعات از فایل‌های موجود یا حتی تبدیل محتوای HTML به PDF داشته باشید، Python-PDFKit شما را تحت پوشش قرار می‌دهد. مدیریت این کتابخانه بسیار آسان است و کاربران را قادر می‌سازد تا فایل‌های PDF را از HTML، URL، یا رشته‌های HTML خام به‌طور یکپارچه تولید کنند.

Python-PDFKit یک پوشش پایتون برای ابزار محبوب تبدیل PDF، wkhtmltopdf است که به زبان C++ نوشته شده است. با استفاده از این کتابخانه، توسعه دهندگان می توانند به راحتی تولید و دستکاری PDF را در برنامه های پایتون خود ادغام کنند. چندین ویژگی مهم در کتابخانه برای مدیریت اسناد PDF از طریق ایجاد PDF از فایل های HTML، ایجاد PDF از URL ها، سفارشی سازی فرآیند تولید PDF، تبدیل مستقیم محتوای HTML به PDF، ادغام چندین سند PDF در یک فایل واحد، مدیریت فایل های PDF وجود دارد. /footers، تنظیم اندازه صفحه PDF و بسیاری موارد دیگر.

کتابخانه Python-PDFKit یک رابط بصری و ساده برای تعامل با ابزار خط فرمان زیربنایی wkhtmltopdf فراهم می‌کند و توسعه‌دهندگان نرم‌افزار را قادر می‌سازد تا اسناد PDF را بدون زحمت ایجاد، ادغام و تبدیل کنند. گزینه های پیکربندی متعدد آن امکان تنظیم دقیق خروجی PDF را با توجه به نیازهای خاص فراهم می کند. Python-PDFKit با فرآیند نصب آسان و استفاده آسان، افزودنی ارزشمند به جعبه ابزار هر توسعه دهنده است. در پایان، Python-PDFKit یک کتابخانه ضروری برای هر توسعه‌دهنده پایتون است که به دنبال ساده‌سازی وظایف تولید PDF و تولید اسناد حرفه‌ای به آسانی است.

Previous Next

شروع به کار با Python-PDFKit

توصیه شده و ساده ترین راه برای نصب Python-PDFKit استفاده از pip است. لطفاً از دستور زیر برای نصب روان استفاده کنید.

Python-PDFKit را از طریق پیپ نصب کنید

 pip install pdfkit 

همچنین می توانید آن را به صورت دستی نصب کنید. آخرین فایل های نسخه را مستقیماً از مخزن GitHub دانلود کنید.

متن را از PDF از طریق پایتون استخراج کنید

کتابخانه Python-PDFKit قابلیت استخراج برنامه‌ای متن از فایل‌های PDF از طریق پایتون را فراهم می‌کند. بازیابی داده ها از یک فایل PDF کار آسانی نیست زیرا نحوه ذخیره سازی اطلاعات PDF فقط دستیابی به آن را دشوار می کند. Python-PDFKit با ارائه آسان توابع داخلی برای بازیابی اطلاعات، کار توسعه دهندگان را آسان می کند. آنها می توانند از متد ()extractText در شی صفحه برای دریافت محتوای متنی صفحه استفاده کنند.

متن را از PDF از طریق پایتون استخراج کنید

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

ایجاد اسناد PDF از طریق Python API

کتابخانه منبع باز Python-PDFKit این امکان را برای توسعه دهندگان نرم افزار فراهم می کند تا به راحتی فایل PDF را در برنامه های پایتون خود تولید کنند. این کتابخانه برای تولید PDF از منابع مختلف پشتیبانی ارائه کرده است. این کتابخانه به توسعه دهندگان نرم افزار اجازه می دهد تا فایل های PDF را از فایل های HTML، رشته ها یا حتی URL ها ایجاد کنند. همچنین امکان افزودن تصاویر، سرصفحه ها و پاورقی ها، تنظیم اندازه صفحه، تنظیم حاشیه و غیره در برنامه های پایتون وجود دارد. مثال زیر نشان می دهد که چگونه توسعه دهندگان نرم افزار می توانند فایل های PDF را از منابع مختلف تنها با چند خط کد پایتون تولید کنند.

یک PDF از یک فایل HTML، رشته یا URL از طریق Python API تولید کنید

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

سفارشی کردن تولید PDF در برنامه های پایتون

کتابخانه منبع باز Python-PDFKit به توسعه دهندگان نرم افزار امکان می دهد تا فرآیند تولید PDF را در برنامه های خود سفارشی کنند. توسعه‌دهندگان نرم‌افزار می‌توانند گزینه‌های مختلفی مانند اندازه صفحه، حاشیه‌ها، سرصفحه‌ها/پانویس‌ها، ادغام چندین سند PDF و موارد دیگر را مشخص کنند. این گزینه ها به عنوان آرگومان های خط فرمان به wkhtmltopdf منتقل می شوند. مثال زیر نشان می دهد که چگونه توسعه دهندگان نرم افزار می توانند فرآیند تولید PDF را در برنامه های پایتون سفارشی کنند.

چگونه فرآیند تولید PDF را از طریق Python API سفارشی کنیم؟

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

تبدیل HTML به PDF از طریق کتابخانه Python

کتابخانه منبع باز Python-PDFKit یک کتابخانه بسیار آسان برای بارگیری و تبدیل اسناد HTML به فایل های PDF در داخل برنامه های پایتون آنها است. علاوه بر تولید PDF، این کتابخانه می‌تواند محتوای HTML را مستقیماً بدون ذخیره یک فایل میانی به PDF تبدیل کند. این می تواند هنگام برخورد با محتوای پویا یا تولید فایل های PDF در لحظه مفید باشد. در زیر یک مثال ساده است که نشان می دهد چگونه برنامه نویسان کامپیوتر می توانند اسناد HTML را به فایل های PDF داخل برنامه های پایتون تبدیل کنند.

 

چگونه اسناد HTML را از طریق پایتون به فایل‌های PDF تبدیل کنیم؟

import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 فارسی