สร้างและจัดการเอกสาร PDF ผ่าน Python API ฟรี

ไลบรารี Open Source Python สำหรับการสร้างและปรับแต่งไฟล์ PDF รวม PDF หลายไฟล์ และแยกข้อความจาก PDF ใช้ Wkhtmltopdf Python Wrapper เพื่อแปลง HTML เป็น PDF

Python เป็นภาษาที่นักพัฒนาซอฟต์แวร์และนักวิทยาศาสตร์ข้อมูลใช้กันมานานแล้ว เนื่องจากความเรียบง่ายและความสามารถรอบด้าน ข้อดีอย่างหนึ่งของ Python ก็คือระบบนิเวศอันอุดมสมบูรณ์ของไลบรารีที่ครอบคลุมโดเมนต่างๆ หนึ่งในไลบรารีดังกล่าวคือ Python-PDFKit ซึ่งเป็นเครื่องมืออันทรงพลังสำหรับการจัดการ PDF ใน Python ไม่ว่าคุณจะต้องการสร้าง PDF แยกข้อมูลจากไฟล์ที่มีอยู่ หรือแม้แต่แปลงเนื้อหา HTML เป็น PDF Python-PDFKit ก็ช่วยคุณได้ ไลบรารีนี้จัดการได้ง่ายมากและช่วยให้ผู้ใช้สามารถสร้าง PDF จาก HTML, URL หรือสตริง HTML แบบดิบได้อย่างราบรื่น

Python-PDFKit เป็น wrapper Python สำหรับเครื่องมือแปลง PDF ยอดนิยม wkhtmltopdf ซึ่งเขียนด้วยภาษา C++ ด้วยไลบรารีนี้ นักพัฒนาสามารถรวมการสร้างและการจัดการ PDF เข้ากับแอปพลิเคชัน Python ของตนได้อย่างง่ายดาย มีคุณสมบัติที่สำคัญหลายประการในไลบรารีสำหรับการจัดการเอกสาร PDF ผ่านการสร้าง PDF จากไฟล์ HTML, การสร้าง PDF จาก URL, ปรับแต่งกระบวนการสร้าง PDF, แปลงเนื้อหา HTML เป็น PDF โดยตรง, รวมเอกสาร PDF หลายฉบับเป็นไฟล์เดียว, การจัดการ PDF ได้ยิน /footers การตั้งค่าขนาดหน้า PDF และอื่นๆ อีกมากมาย

ไลบรารี Python-PDFKit มอบอินเทอร์เฟซที่ใช้งานง่ายและตรงไปตรงมาเพื่อโต้ตอบกับเครื่องมือบรรทัดคำสั่ง wkhtmltopdf ที่สำคัญ ช่วยให้นักพัฒนาซอฟต์แวร์สามารถสร้าง ผสาน และแปลงเอกสาร PDF ได้อย่างง่ายดาย ตัวเลือกการกำหนดค่ามากมายทำให้สามารถปรับเอาต์พุต PDF ได้อย่างละเอียดตามความต้องการเฉพาะ ด้วยกระบวนการติดตั้งที่ง่ายดายและการใช้งานที่ไม่ซับซ้อน Python-PDFKit จึงเป็นส่วนเสริมที่มีคุณค่าสำหรับชุดเครื่องมือของนักพัฒนา โดยสรุป Python-PDFKit เป็นไลบรารีที่ต้องลองสำหรับนักพัฒนา Python ที่ต้องการปรับปรุงงานการสร้าง PDF และสร้างเอกสารที่ดูเป็นมืออาชีพได้อย่างง่ายดาย

Previous Next

เริ่มต้นใช้งาน Python-PDFKit

วิธีที่แนะนำและง่ายที่สุดในการติดตั้ง Python-PDFKit คือการใช้ pip โปรดใช้คำสั่งต่อไปนี้เพื่อให้การติดตั้งราบรื่น

ติดตั้ง Python-PDFKit ผ่าน pip

 pip install pdfkit 

คุณยังสามารถติดตั้งได้ด้วยตนเอง ดาวน์โหลดไฟล์รุ่นล่าสุดได้โดยตรงจากที่เก็บ GitHub

แยกข้อความจาก PDF ผ่าน Python

ไลบรารี Python-PDFKit มอบความสามารถในการแยกข้อความจากไฟล์ PDF โดยทางโปรแกรมผ่าน Python การดึงข้อมูลจากไฟล์ PDF ไม่ใช่เรื่องง่าย เนื่องจากวิธีที่ PDF จัดเก็บข้อมูลทำให้ยากต่อการบรรลุผล Python-PDFKit ช่วยให้นักพัฒนาทำงานได้ง่ายขึ้นโดยมอบฟังก์ชันในตัวที่ใช้งานง่ายสำหรับการดึงข้อมูล พวกเขาสามารถใช้เมธอด extractText() บนวัตถุหน้าเพื่อรับเนื้อหาข้อความของหน้า

แยกข้อความจาก PDF ผ่าน Python

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

การสร้างเอกสาร PDF ผ่าน Python API

ไลบรารี Python-PDFKit แบบโอเพ่นซอร์สทำให้นักพัฒนาซอฟต์แวร์สามารถสร้างไฟล์ PDF ภายในแอปพลิเคชัน Python ได้อย่างง่ายดาย ห้องสมุดได้ให้การสนับสนุนในการสร้าง PDF จากแหล่งต่างๆ ไลบรารีช่วยให้นักพัฒนาซอฟต์แวร์สามารถสร้าง PDF จากไฟล์ HTML, สตริง หรือแม้แต่ URL นอกจากนี้ยังสามารถเพิ่มรูปภาพ ส่วนหัวและส่วนท้าย กำหนดขนาดหน้า กำหนดระยะขอบ และอื่นๆ ภายในแอปพลิเคชัน Python ได้ ตัวอย่างต่อไปนี้แสดงให้เห็นว่านักพัฒนาซอฟต์แวร์สามารถสร้างไฟล์ PDF จากแหล่งต่างๆ ด้วยโค้ด Python เพียงไม่กี่บรรทัดได้อย่างไร

สร้าง PDF จากไฟล์ HTML, สตริงหรือ URL ผ่าน Python API

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

การปรับแต่งการสร้าง PDF ภายในแอป Python

ไลบรารีโอเพ่นซอร์ส Python-PDFKit ช่วยให้นักพัฒนาซอฟต์แวร์สามารถปรับแต่งกระบวนการสร้าง PDF ภายในแอปพลิเคชันของตนเองได้ นักพัฒนาซอฟต์แวร์สามารถระบุตัวเลือกต่างๆ ได้ เช่น ขนาดหน้า ระยะขอบ ส่วนหัว/ส่วนท้าย การรวมเอกสาร PDF หลายชุด และอื่นๆ ตัวเลือกเหล่านี้ถูกส่งไปยัง wkhtmltopdf เป็นอาร์กิวเมนต์บรรทัดคำสั่ง ตัวอย่างต่อไปนี้แสดงให้เห็นว่านักพัฒนาซอฟต์แวร์สามารถปรับแต่งกระบวนการสร้าง PDF ภายในแอปพลิเคชัน Python ได้อย่างไร

จะปรับแต่งกระบวนการสร้าง PDF ผ่าน Python API ได้อย่างไร

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

แปลง HTML เป็น PDF ผ่าน Python Library

ไลบรารีโอเพ่นซอร์ส Python-PDFKit เป็นไลบรารีที่ใช้งานง่ายมากสำหรับการโหลดและแปลงเอกสาร HTML เป็นไฟล์ PDF ภายในแอปพลิเคชัน Python นอกจากการสร้าง PDF แล้ว ไลบรารียังสามารถแปลงเนื้อหา HTML เป็น PDF ได้โดยตรงโดยไม่ต้องบันทึกไฟล์ระดับกลาง สิ่งนี้มีประโยชน์เมื่อต้องจัดการกับเนื้อหาแบบไดนามิกหรือสร้าง PDF ได้ทันที ด้านล่างนี้เป็นตัวอย่างง่ายๆ ที่แสดงให้เห็นว่าโปรแกรมเมอร์คอมพิวเตอร์สามารถแปลงเอกสาร HTML เป็นไฟล์ PDF ภายในแอปพลิเคชัน Python ได้อย่างไร

 

จะแปลงเอกสาร HTML เป็นไฟล์ PDF ผ่าน Python ได้อย่างไร

import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 ไทย