1. Produkter
  2.   PDF
  3.   Python
  4.   Python-PDFKit
 
  

Generer og administrer PDF-dokumenter via gratis Python API

Open Source Python-bibliotek for å lage og tilpasse PDF-filer, slå sammen flere PDF-er og trekke ut tekst fra PDF. Den bruker Wkhtmltopdf Python Wrapper for å konvertere HTML til PDF.

Python har lenge vært et populært språk for programvareutviklere og dataforskere på grunn av dets enkelhet og allsidighet. En av de mange fordelene med Python er dets rike økosystem av biblioteker som dekker ulike domener. Et slikt bibliotek er Python-PDFKit, et kraftig verktøy for PDF-manipulering i Python. Enten du trenger å generere PDF-er, trekke ut informasjon fra eksisterende, eller til og med konvertere HTML-innhold til PDF, har Python-PDFKit deg dekket. Biblioteket er veldig enkelt å håndtere og gjør det mulig for brukere å generere PDF-filer fra HTML, URL eller rå HTML-strenger sømløst.

Python-PDFKit er en Python-innpakning for det populære PDF-konverteringsverktøyet, wkhtmltopdf, som er skrevet i C++. Med dette biblioteket kan utviklere enkelt integrere PDF-generering og manipulering i Python-applikasjonene sine. Det er flere viktige funksjoner i biblioteket for å håndtere PDF-dokumenter via å lage PDF-er fra HTML-filer, lage PDF-er fra URL-er, tilpasse PDF-genereringsprosessen, konvertere HTML-innhold til PDF direkte, slå sammen flere PDF-dokumenter til en enkelt fil, administrere PDF-høringer /bunntekst, innstilling av PDF-sidestørrelse og mange flere.

Python-PDFKit-biblioteket gir et intuitivt og enkelt grensesnitt for å samhandle med det underliggende kommandolinjeverktøyet wkhtmltopdf, som gjør det mulig for programvareutviklere å lage, slå sammen og konvertere PDF-dokumenter uten problemer. Dens mange konfigurasjonsalternativer gjør det mulig å finjustere PDF-utdata i henhold til spesifikke krav. Med sin enkle installasjonsprosess og enkle bruk, er Python-PDFKit et verdifullt tillegg til enhver utvikleres verktøysett. Avslutningsvis er Python-PDFKit et bibliotek som må prøves for enhver Python-utvikler som ønsker å strømlinjeforme PDF-genereringsoppgaver og produsere profesjonelt utseende dokumenter med letthet.

Previous Next

Kom i gang med Python-PDFKit

Den anbefalte og enkleste måten å installere Python-PDFKit på er å bruke pip. Bruk følgende kommando for en jevn installasjon.

Installer Python-PDFKit via pip

 pip install pdfkit 

Du kan også installere det manuelt; last ned de siste utgivelsesfilene direkte fra GitHub-depotet.

trekk ut tekst fra PDF via Python

Python-PDFKit-biblioteket gir mulighet for programmatisk uttrekking av tekst fra PDF-filer via Python. Det er ikke lett å hente data fra en PDF-fil fordi måten PDF lagrer informasjon på gjør det vanskelig å oppnå det. Python-PDFKit gjør utviklere jobben enkel ved å gi dem brukervennlige innebygde funksjoner for å hente informasjon. De kan bruke metoden extractText() på sideobjektet for å få tekstinnholdet på siden.

Trekk ut tekst fra PDF via Python

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

Generering av PDF-dokumenter via Python API

Åpen kildekode Python-PDFKit-biblioteket gjør det enkelt for programvareutviklere å generere PDF-filer med letthet i sine Python-applikasjoner. Biblioteket har gitt støtte for å generere PDF-filer fra ulike kilder. Biblioteket lar programvareutviklere lage PDF-filer fra HTML-filer, strenger eller til og med URL-er. Det er også mulig å legge til bilder, topptekster og bunntekster, angi sidestørrelse, angi marger og så videre inne i Python-applikasjoner. Følgende eksempel viser hvordan programvareutviklere kan generere PDF-filer fra forskjellige kilder med bare et par linjers Python-kode.

Generer en PDF fra en HTML-fil, streng eller URL via Python API

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

Tilpasse PDF-generering i Python-apper

Open source Python-PDFKit-biblioteket gjør det mulig for programvareutviklere å tilpasse PDF-genereringsprosessen i sine egne applikasjoner. Programvareutviklere kan spesifisere ulike alternativer som sidestørrelse, marger, topptekst/bunntekst, sammenslåing av flere PDF-dokumenter og mer. Disse alternativene sendes til wkhtmltopdf som kommandolinjeargumenter. Følgende eksempel viser hvordan programvareutviklere kan tilpasse PDF-genereringsprosessen i Python-applikasjoner.

Hvordan tilpasser jeg PDF-genereringsprosessen via Python API?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

Konverter HTML til PDF via Python Library

Åpen kildekode Python-PDFKit-biblioteket er et veldig enkelt å bruke bibliotek for å laste og konvertere HTML-dokumenter til PDF-filer i deres Python-applikasjoner. I tillegg til å generere PDF-filer, kan biblioteket konvertere HTML-innhold til PDF direkte uten å lagre en mellomfil. Dette kan være nyttig når du arbeider med dynamisk innhold eller genererer PDF-er på farten. Nedenfor er et enkelt eksempel som viser hvordan dataprogrammerere kan konvertere HTML-dokumenter til PDF-filer i Python-applikasjoner.

 

Hvordan konvertere HTML-dokumenter til PDF-filer via Python?

import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 Norsk