สร้างและจัดการเอกสาร PDF ผ่าน Python API ฟรี
ไลบรารี Open Source Python สำหรับการสร้างและปรับแต่งไฟล์ PDF รวม PDF หลายไฟล์ และแยกข้อความจาก PDF ใช้ Wkhtmltopdf Python Wrapper เพื่อแปลง HTML เป็น PDF
Python เป็นภาษาที่นักพัฒนาซอฟต์แวร์และนักวิทยาศาสตร์ข้อมูลใช้กันมานานแล้ว เนื่องจากความเรียบง่ายและความสามารถรอบด้าน ข้อดีอย่างหนึ่งของ Python ก็คือระบบนิเวศอันอุดมสมบูรณ์ของไลบรารีที่ครอบคลุมโดเมนต่างๆ หนึ่งในไลบรารีดังกล่าวคือ Python-PDFKit ซึ่งเป็นเครื่องมืออันทรงพลังสำหรับการจัดการ PDF ใน Python ไม่ว่าคุณจะต้องการสร้าง PDF แยกข้อมูลจากไฟล์ที่มีอยู่ หรือแม้แต่แปลงเนื้อหา HTML เป็น PDF Python-PDFKit ก็ช่วยคุณได้ ไลบรารีนี้จัดการได้ง่ายมากและช่วยให้ผู้ใช้สามารถสร้าง PDF จาก HTML, URL หรือสตริง HTML แบบดิบได้อย่างราบรื่น
Python-PDFKit เป็น wrapper Python สำหรับเครื่องมือแปลง PDF ยอดนิยม wkhtmltopdf ซึ่งเขียนด้วยภาษา C++ ด้วยไลบรารีนี้ นักพัฒนาสามารถรวมการสร้างและการจัดการ PDF เข้ากับแอปพลิเคชัน Python ของตนได้อย่างง่ายดาย มีคุณสมบัติที่สำคัญหลายประการในไลบรารีสำหรับการจัดการเอกสาร PDF ผ่านการสร้าง PDF จากไฟล์ HTML, การสร้าง PDF จาก URL, ปรับแต่งกระบวนการสร้าง PDF, แปลงเนื้อหา HTML เป็น PDF โดยตรง, รวมเอกสาร PDF หลายฉบับเป็นไฟล์เดียว, การจัดการ PDF ได้ยิน /footers การตั้งค่าขนาดหน้า PDF และอื่นๆ อีกมากมาย
ไลบรารี Python-PDFKit มอบอินเทอร์เฟซที่ใช้งานง่ายและตรงไปตรงมาเพื่อโต้ตอบกับเครื่องมือบรรทัดคำสั่ง wkhtmltopdf ที่สำคัญ ช่วยให้นักพัฒนาซอฟต์แวร์สามารถสร้าง ผสาน และแปลงเอกสาร PDF ได้อย่างง่ายดาย ตัวเลือกการกำหนดค่ามากมายทำให้สามารถปรับเอาต์พุต PDF ได้อย่างละเอียดตามความต้องการเฉพาะ ด้วยกระบวนการติดตั้งที่ง่ายดายและการใช้งานที่ไม่ซับซ้อน Python-PDFKit จึงเป็นส่วนเสริมที่มีคุณค่าสำหรับชุดเครื่องมือของนักพัฒนา โดยสรุป Python-PDFKit เป็นไลบรารีที่ต้องลองสำหรับนักพัฒนา Python ที่ต้องการปรับปรุงงานการสร้าง PDF และสร้างเอกสารที่ดูเป็นมืออาชีพได้อย่างง่ายดาย
เริ่มต้นใช้งาน Python-PDFKit
วิธีที่แนะนำและง่ายที่สุดในการติดตั้ง Python-PDFKit คือการใช้ pip โปรดใช้คำสั่งต่อไปนี้เพื่อให้การติดตั้งราบรื่น
ติดตั้ง Python-PDFKit ผ่าน pip
pip install pdfkit
คุณยังสามารถติดตั้งได้ด้วยตนเอง ดาวน์โหลดไฟล์รุ่นล่าสุดได้โดยตรงจากที่เก็บ GitHub
แยกข้อความจาก PDF ผ่าน Python
ไลบรารี Python-PDFKit มอบความสามารถในการแยกข้อความจากไฟล์ PDF โดยทางโปรแกรมผ่าน Python การดึงข้อมูลจากไฟล์ PDF ไม่ใช่เรื่องง่าย เนื่องจากวิธีที่ PDF จัดเก็บข้อมูลทำให้ยากต่อการบรรลุผล Python-PDFKit ช่วยให้นักพัฒนาทำงานได้ง่ายขึ้นโดยมอบฟังก์ชันในตัวที่ใช้งานง่ายสำหรับการดึงข้อมูล พวกเขาสามารถใช้เมธอด extractText() บนวัตถุหน้าเพื่อรับเนื้อหาข้อความของหน้า
แยกข้อความจาก PDF ผ่าน Python
// extract text from a PDF
from Python-PDFKit import PdfReader
reader = PdfReader("example.pdf")
page = reader.pages[0]
print(page.extract_text())
การสร้างเอกสาร PDF ผ่าน Python API
ไลบรารี Python-PDFKit แบบโอเพ่นซอร์สทำให้นักพัฒนาซอฟต์แวร์สามารถสร้างไฟล์ PDF ภายในแอปพลิเคชัน Python ได้อย่างง่ายดาย ห้องสมุดได้ให้การสนับสนุนในการสร้าง PDF จากแหล่งต่างๆ ไลบรารีช่วยให้นักพัฒนาซอฟต์แวร์สามารถสร้าง PDF จากไฟล์ HTML, สตริง หรือแม้แต่ URL นอกจากนี้ยังสามารถเพิ่มรูปภาพ ส่วนหัวและส่วนท้าย กำหนดขนาดหน้า กำหนดระยะขอบ และอื่นๆ ภายในแอปพลิเคชัน Python ได้ ตัวอย่างต่อไปนี้แสดงให้เห็นว่านักพัฒนาซอฟต์แวร์สามารถสร้างไฟล์ PDF จากแหล่งต่างๆ ด้วยโค้ด Python เพียงไม่กี่บรรทัดได้อย่างไร
สร้าง PDF จากไฟล์ HTML, สตริงหรือ URL ผ่าน Python API
import pdfkit
# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")
# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!
"
pdfkit.from_string(html_string, "output.pdf")
# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")
การปรับแต่งการสร้าง PDF ภายในแอป Python
ไลบรารีโอเพ่นซอร์ส Python-PDFKit ช่วยให้นักพัฒนาซอฟต์แวร์สามารถปรับแต่งกระบวนการสร้าง PDF ภายในแอปพลิเคชันของตนเองได้ นักพัฒนาซอฟต์แวร์สามารถระบุตัวเลือกต่างๆ ได้ เช่น ขนาดหน้า ระยะขอบ ส่วนหัว/ส่วนท้าย การรวมเอกสาร PDF หลายชุด และอื่นๆ ตัวเลือกเหล่านี้ถูกส่งไปยัง wkhtmltopdf เป็นอาร์กิวเมนต์บรรทัดคำสั่ง ตัวอย่างต่อไปนี้แสดงให้เห็นว่านักพัฒนาซอฟต์แวร์สามารถปรับแต่งกระบวนการสร้าง PDF ภายในแอปพลิเคชัน Python ได้อย่างไร
จะปรับแต่งกระบวนการสร้าง PDF ผ่าน Python API ได้อย่างไร
import pdfkit
options = {
'page-size': 'A4',
'margin-top': '0mm',
'margin-right': '0mm',
'margin-bottom': '0mm',
'margin-left': '0mm',
}
pdfkit.from_file("source.html", "output.pdf", options=options)
แปลง HTML เป็น PDF ผ่าน Python Library
ไลบรารีโอเพ่นซอร์ส Python-PDFKit เป็นไลบรารีที่ใช้งานง่ายมากสำหรับการโหลดและแปลงเอกสาร HTML เป็นไฟล์ PDF ภายในแอปพลิเคชัน Python นอกจากการสร้าง PDF แล้ว ไลบรารียังสามารถแปลงเนื้อหา HTML เป็น PDF ได้โดยตรงโดยไม่ต้องบันทึกไฟล์ระดับกลาง สิ่งนี้มีประโยชน์เมื่อต้องจัดการกับเนื้อหาแบบไดนามิกหรือสร้าง PDF ได้ทันที ด้านล่างนี้เป็นตัวอย่างง่ายๆ ที่แสดงให้เห็นว่าโปรแกรมเมอร์คอมพิวเตอร์สามารถแปลงเอกสาร HTML เป็นไฟล์ PDF ภายในแอปพลิเคชัน Python ได้อย่างไร
จะแปลงเอกสาร HTML เป็นไฟล์ PDF ผ่าน Python ได้อย่างไร
import pdfkit
html_string = "Hello, PDFKit!
"
pdf_bytes = pdfkit.from_string(html_string, False)
# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
f.write(pdf_bytes)