Hasilkan dan Kelola Dokumen PDF melalui API Python Gratis
Pustaka Python Sumber Terbuka untuk membuat dan menyesuaikan file PDF, menggabungkan beberapa PDF & mengekstrak teks dari PDF. Ia menggunakan Wkhtmltopdf Python Wrapper untuk Mengonversi HTML ke PDF.
Python telah lama menjadi bahasa yang digunakan oleh pengembang perangkat lunak dan ilmuwan data karena kesederhanaan dan fleksibilitasnya. Salah satu dari banyak keunggulan Python adalah ekosistem perpustakaannya yang kaya yang mencakup berbagai domain. Salah satu perpustakaan tersebut adalah Python-PDFKit, alat yang ampuh untuk manipulasi PDF dengan Python. Apakah Anda perlu membuat PDF, mengekstrak informasi dari yang sudah ada, atau bahkan mengonversi konten HTML ke PDF, Python-PDFKit siap membantu Anda. Pustaka ini sangat mudah digunakan dan memungkinkan pengguna membuat PDF dari HTML, URL, atau string HTML mentah dengan lancar.
Python-PDFKit adalah pembungkus Python untuk alat konversi PDF populer, wkhtmltopdf, yang ditulis dalam C++. Dengan perpustakaan ini, pengembang dapat dengan mudah mengintegrasikan pembuatan dan manipulasi PDF ke dalam aplikasi Python mereka. Ada beberapa fitur penting bagian dari perpustakaan untuk menangani dokumen PDF melalui pembuatan PDF dari file HTML, membuat PDF dari URL, menyesuaikan proses pembuatan PDF, mengonversi konten HTML ke PDF secara langsung, menggabungkan beberapa dokumen PDF menjadi satu file, mengelola pendengaran PDF /footers, mengatur ukuran halaman PDF dan masih banyak lagi.
Pustaka Python-PDFKit menyediakan antarmuka yang intuitif dan lugas untuk berinteraksi dengan alat baris perintah wkhtmltopdf yang mendasarinya, memungkinkan pengembang perangkat lunak membuat, menggabungkan, dan mengonversi dokumen PDF dengan mudah. Berbagai pilihan konfigurasinya memungkinkan penyesuaian keluaran PDF sesuai dengan kebutuhan spesifik. Dengan proses instalasi yang mudah dan penggunaan yang mudah, Python-PDFKit adalah tambahan berharga untuk perangkat pengembang mana pun. Kesimpulannya, Python-PDFKit adalah perpustakaan yang wajib dicoba oleh pengembang Python mana pun yang ingin menyederhanakan tugas pembuatan PDF dan menghasilkan dokumen yang terlihat profesional dengan mudah.
Memulai dengan Python-PDFKit
Cara yang disarankan dan termudah untuk menginstal Python-PDFKit adalah menggunakan pip. Silakan gunakan perintah berikut untuk kelancaran instalasi.
Instal Python-PDFKit melalui pip
pip install pdfkit
Anda juga dapat menginstalnya secara manual; unduh file rilis terbaru langsung dari repositori GitHub.
Ekstrak Teks dari PDF melalui Python
Perpustakaan Python-PDFKit menyediakan kemampuan untuk mengekstraksi teks dari file PDF secara terprogram melalui Python. Tidak mudah untuk mengambil data dari file PDF karena cara PDF menyimpan informasi membuat sulit untuk mencapainya. Python-PDFKit memudahkan pekerjaan pengembang dengan menyediakan fungsi bawaan yang mudah digunakan untuk mengambil informasi. Mereka dapat menggunakan metode ekstrakTeks() pada objek halaman untuk mendapatkan konten teks halaman.
Ekstrak Teks dari PDF melalui Python
// extract text from a PDF
from Python-PDFKit import PdfReader
reader = PdfReader("example.pdf")
page = reader.pages[0]
print(page.extract_text())
Membuat Dokumen PDF melalui Python API
Perpustakaan Python-PDFKit sumber terbuka memudahkan pengembang perangkat lunak untuk menghasilkan file PDF dengan mudah di dalam aplikasi Python mereka. Perpustakaan telah menyediakan dukungan untuk menghasilkan PDF dari berbagai sumber. Perpustakaan memungkinkan pengembang perangkat lunak membuat PDF dari file HTML, string, atau bahkan URL. Dimungkinkan juga untuk menambahkan gambar, header dan footer, mengatur ukuran halaman, mengatur margin, dan sebagainya di dalam aplikasi Python. Contoh berikut menunjukkan bagaimana pengembang perangkat lunak dapat menghasilkan file PDF dari berbagai sumber hanya dengan beberapa baris kode Python.
Buat PDF dari File HTML, String, atau URL melalui Python API
import pdfkit
# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")
# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!
"
pdfkit.from_string(html_string, "output.pdf")
# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")
Menyesuaikan Pembuatan PDF di dalam Aplikasi Python
Perpustakaan Python-PDFKit sumber terbuka memungkinkan pengembang perangkat lunak menyesuaikan proses pembuatan PDF di dalam aplikasi mereka sendiri. Pengembang perangkat lunak dapat menentukan berbagai opsi seperti ukuran halaman, margin, header/footer, menggabungkan beberapa dokumen PDF, dan banyak lagi. Opsi ini diteruskan ke wkhtmltopdf sebagai argumen baris perintah. Contoh berikut menunjukkan bagaimana pengembang perangkat lunak dapat menyesuaikan proses pembuatan PDF di dalam aplikasi Python.
Bagaimana Menyesuaikan Proses Pembuatan PDF melalui Python API?
import pdfkit
options = {
'page-size': 'A4',
'margin-top': '0mm',
'margin-right': '0mm',
'margin-bottom': '0mm',
'margin-left': '0mm',
}
pdfkit.from_file("source.html", "output.pdf", options=options)
Konversi HTML ke PDF melalui Perpustakaan Python
Perpustakaan Python-PDFKit sumber terbuka adalah perpustakaan yang sangat mudah digunakan untuk memuat dan mengonversi dokumen HTML ke file PDF di dalam aplikasi Python mereka. Selain menghasilkan PDF, perpustakaan dapat mengkonversi konten HTML ke PDF secara langsung tanpa menyimpan file perantara. Ini dapat berguna ketika menangani konten dinamis atau membuat PDF dengan cepat. Di bawah ini adalah contoh sederhana yang menunjukkan bagaimana pemrogram komputer dapat mengonversi dokumen HTML menjadi file PDF di dalam aplikasi Python.
Bagaimana Mengonversi Dokumen HTML ke File PDF melalui Python?
import pdfkit
html_string = "Hello, PDFKit!
"
pdf_bytes = pdfkit.from_string(html_string, False)
# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
f.write(pdf_bytes)