Generuokite ir tvarkykite PDF dokumentus naudodami nemokamą Python API
Atvirojo kodo Python biblioteka skirta kurti ir tinkinti PDF failus, sujungti kelis PDF failus ir ištraukti tekstą iš PDF. Jis naudoja Wkhtmltopdf Python Wrapper HTML konvertavimui į PDF.
Dėl savo paprastumo ir universalumo „Python“ jau seniai buvo mėgstama programinės įrangos kūrėjų ir duomenų mokslininkų kalba. Vienas iš daugelio Python privalumų yra turtinga bibliotekų ekosistema, apimanti įvairias sritis. Viena iš tokių bibliotekų yra „Python-PDFKit“, galingas „Python“ PDF manipuliavimo įrankis. Nesvarbu, ar jums reikia generuoti PDF failus, išgauti informaciją iš esamų, ar net konvertuoti HTML turinį į PDF, Python-PDFKit jums padės. Biblioteka yra labai paprasta valdyti ir leidžia vartotojams sklandžiai generuoti PDF failus iš HTML, URL arba neapdorotų HTML eilučių.
Python-PDFKit yra Python paketas, skirtas populiariam PDF konvertavimo įrankiui wkhtmltopdf, kuris parašytas C++. Naudodami šią biblioteką kūrėjai gali lengvai integruoti PDF generavimą ir manipuliavimą į savo Python programas. Yra keletas svarbių bibliotekos funkcijų, skirtų tvarkyti PDF dokumentus, kuriant PDF failus iš HTML failų, kuriant PDF failus iš URL, tinkinant PDF generavimo procesą, tiesiogiai konvertuojant HTML turinį į PDF, sujungiant kelis PDF dokumentus į vieną failą, tvarkant PDF klausymes. /footers, PDF puslapio dydžio nustatymas ir daug daugiau.
Python-PDFKit bibliotekoje yra intuityvi ir paprasta sąsaja, skirta sąveikai su pagrindiniu wkhtmltopdf komandinės eilutės įrankiu, leidžianti programinės įrangos kūrėjams be vargo kurti, sujungti ir konvertuoti PDF dokumentus. Daugybė konfigūravimo parinkčių leidžia tiksliai sureguliuoti PDF išvestį pagal konkrečius reikalavimus. Lengvas diegimo procesas ir paprastas naudojimas Python-PDFKit yra vertingas bet kurio kūrėjo įrankių rinkinio papildymas. Apibendrinant galima pasakyti, kad „Python-PDFKit“ yra biblioteka, kurią privalo išbandyti kiekvienas „Python“ kūrėjas, norintis supaprastinti PDF generavimo užduotis ir lengvai sukurti profesionaliai atrodančius dokumentus.
Pradedant naudotis Python-PDFKit
Rekomenduojamas ir lengviausias būdas įdiegti Python-PDFKit yra naudoti pip. Norėdami sklandžiai įdiegti, naudokite šią komandą.
Įdiekite Python-PDFKit per pip
pip install pdfkit
Taip pat galite įdiegti rankiniu būdu; atsisiųskite naujausius leidimo failus tiesiai iš GitHub saugyklos.
Ištraukite tekstą iš PDF naudodami Python
Python-PDFKit biblioteka suteikia galimybę programiškai išgauti tekstą iš PDF failų naudojant Python. Duomenis iš PDF failo nėra lengva nuskaityti, nes tai, kaip PDF saugo informaciją, tiesiog apsunkina ją pasiekti. „Python-PDFKit“ palengvina kūrėjų darbą, nes suteikia jiems lengvai naudojamas integruotas informacijos gavimo funkcijas. Jie gali naudoti puslapio objekto metodą extractText(), kad gautų puslapio tekstinį turinį.
Ištraukite tekstą iš PDF naudodami Python
// extract text from a PDF
from Python-PDFKit import PdfReader
reader = PdfReader("example.pdf")
page = reader.pages[0]
print(page.extract_text())
PDF dokumentų generavimas naudojant Python API
Atvirojo kodo Python-PDFKit biblioteka leidžia programinės įrangos kūrėjams lengvai sugeneruoti PDF failą savo Python programose. Biblioteka suteikė paramą kuriant PDF failus iš įvairių šaltinių. Biblioteka leidžia programinės įrangos kūrėjams kurti PDF failus iš HTML failų, eilučių ar net URL. Taip pat Python programose galima pridėti vaizdų, antraštes ir poraštes, nustatyti puslapio dydį, paraštes ir pan. Toliau pateiktame pavyzdyje parodyta, kaip programinės įrangos kūrėjai gali generuoti PDF failus iš įvairių šaltinių naudodami tik keletą Python kodo eilučių.
Generuokite PDF iš HTML failo, eilutės arba URL naudodami Python API
import pdfkit
# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")
# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!
"
pdfkit.from_string(html_string, "output.pdf")
# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")
PDF kūrimo tinkinimas Python programose
Atvirojo kodo Python-PDFKit biblioteka leidžia programinės įrangos kūrėjams tinkinti PDF generavimo procesą savo programose. Programinės įrangos kūrėjai gali nurodyti įvairias parinktis, tokias kaip puslapio dydis, paraštės, antraštės / poraštės, kelių PDF dokumentų sujungimas ir kt. Šios parinktys perduodamos wkhtmltopdf kaip komandinės eilutės argumentai. Šiame pavyzdyje parodyta, kaip programinės įrangos kūrėjai gali tinkinti PDF kūrimo procesą Python programose.
Kaip tinkinti PDF generavimo procesą naudojant Python API?
import pdfkit
options = {
'page-size': 'A4',
'margin-top': '0mm',
'margin-right': '0mm',
'margin-bottom': '0mm',
'margin-left': '0mm',
}
pdfkit.from_file("source.html", "output.pdf", options=options)
Konvertuokite HTML į PDF naudodami Python biblioteką
Atvirojo kodo Python-PDFKit biblioteka yra labai paprasta naudoti biblioteka, skirta įkelti ir konvertuoti HTML dokumentus į PDF failus savo Python programose. Be PDF failų generavimo, biblioteka gali konvertuoti HTML turinį į PDF tiesiogiai, neišsaugodama tarpinio failo. Tai gali būti naudinga dirbant su dinamišku turiniu arba generuojant PDF failus. Žemiau pateikiamas paprastas pavyzdys, rodantis, kaip kompiuterių programuotojai gali konvertuoti HTML dokumentus į PDF failus Python programose.
Kaip konvertuoti HTML dokumentus į PDF failus naudojant Python?
import pdfkit
html_string = "Hello, PDFKit!
"
pdf_bytes = pdfkit.from_string(html_string, False)
# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
f.write(pdf_bytes)