Ģenerējiet un pārvaldiet PDF dokumentus, izmantojot bezmaksas Python API
Atvērtā pirmkoda Python bibliotēka, lai izveidotu un pielāgotu PDF failus, apvienotu vairākus PDF failus un izvilktu tekstu no PDF. Tas izmanto Wkhtmltopdf Python Wrapper, lai pārvērstu HTML uz PDF.
Python jau sen ir bijusi programmatūras izstrādātāju un datu zinātnieku iecienītākā valoda tās vienkāršības un daudzpusības dēļ. Viena no daudzajām Python priekšrocībām ir tās bagātīgā bibliotēku ekosistēma, kas aptver dažādas jomas. Viena no šādām bibliotēkām ir Python-PDFKit, jaudīgs rīks PDF manipulācijām programmā Python. Neatkarīgi no tā, vai jums ir jāģenerē PDF faili, jāizņem informācija no esošajiem vai pat jākonvertē HTML saturs PDF formātā, Python-PDFKit jums palīdzēs. Bibliotēka ir ļoti viegli apstrādājama, un tā ļauj lietotājiem nemanāmi ģenerēt PDF failus no HTML, URL vai neapstrādātām HTML virknēm.
Python-PDFKit ir Python iesaiņojums populārajam PDF konvertēšanas rīkam wkhtmltopdf, kas ir rakstīts C++ valodā. Izmantojot šo bibliotēku, izstrādātāji var viegli integrēt PDF ģenerēšanu un manipulācijas savās Python lietojumprogrammās. Bibliotēkas daļai ir vairākas svarīgas funkcijas PDF dokumentu apstrādei, veidojot PDF failus no HTML failiem, veidojot PDF failus no URL, pielāgojot PDF ģenerēšanas procesu, konvertējot HTML saturu tieši PDF formātā, apvienojot vairākus PDF dokumentus vienā failā, pārvaldot PDF klausules. /footers, PDF lapas izmēra iestatīšana un daudz kas cits.
Python-PDFKit bibliotēka nodrošina intuitīvu un vienkāršu saskarni mijiedarbībai ar pamatā esošo komandrindas rīku wkhtmltopdf, ļaujot programmatūras izstrādātājiem bez piepūles izveidot, apvienot un konvertēt PDF dokumentus. Tā daudzās konfigurācijas opcijas ļauj precīzi noregulēt PDF izvadi atbilstoši īpašām prasībām. Pateicoties vienkāršajam instalēšanas procesam un vienkāršai lietošanai, Python-PDFKit ir vērtīgs papildinājums jebkura izstrādātāja rīku komplektam. Visbeidzot, Python-PDFKit ir jāizmēģina bibliotēka ikvienam Python izstrādātājam, kurš vēlas racionalizēt PDF ģenerēšanas uzdevumus un viegli izveidot profesionāla izskata dokumentus.
Darba sākšana ar Python-PDFKit
Ieteicamais un vienkāršākais Python-PDFKit instalēšanas veids ir pip izmantošana. Lūdzu, izmantojiet šo komandu vienmērīgai instalēšanai.
Instalējiet Python-PDFKit, izmantojot pip
pip install pdfkit
Varat to instalēt arī manuāli; lejupielādējiet jaunākos laidiena failus tieši no GitHub krātuves.
Izņemiet tekstu no PDF, izmantojot Python
Python-PDFKit bibliotēka nodrošina iespēju programmatiski izvilkt tekstu no PDF failiem, izmantojot Python. Nav viegli izgūt datus no PDF faila, jo veids, kā PDF glabā informāciju, vienkārši apgrūtina to sasniegšanu. Python-PDFKit atvieglo izstrādātāju darbu, nodrošinot viņiem viegli lietojamas iebūvētās funkcijas informācijas izgūšanai. Viņi lapas objektā var izmantot metodi extractText(), lai iegūtu lapas teksta saturu.
Izņemiet tekstu no PDF faila, izmantojot Python
// extract text from a PDF
from Python-PDFKit import PdfReader
reader = PdfReader("example.pdf")
page = reader.pages[0]
print(page.extract_text())
PDF dokumentu ģenerēšana, izmantojot Python API
Atvērtā pirmkoda Python-PDFKit bibliotēka ļauj programmatūras izstrādātājiem viegli ģenerēt PDF failu savās Python lietojumprogrammās. Bibliotēka ir nodrošinājusi atbalstu PDF failu ģenerēšanai no dažādiem avotiem. Bibliotēka ļauj programmatūras izstrādātājiem izveidot PDF failus no HTML failiem, virknēm vai pat URL. Python lietojumprogrammās ir iespējams arī pievienot attēlus, galvenes un kājenes, iestatīt lapas izmēru, iestatīt piemales un tā tālāk. Šis piemērs parāda, kā programmatūras izstrādātāji var ģenerēt PDF failus no dažādiem avotiem, izmantojot tikai dažas Python koda rindas.
PDF faila ģenerēšana no HTML faila, virknes vai URL, izmantojot Python API
import pdfkit
# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")
# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!
"
pdfkit.from_string(html_string, "output.pdf")
# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")
PDF ģenerēšanas pielāgošana Python lietotnēs
Atvērtā pirmkoda Python-PDFKit bibliotēka ļauj programmatūras izstrādātājiem pielāgot PDF ģenerēšanas procesu savās lietojumprogrammās. Programmatūras izstrādātāji var norādīt dažādas opcijas, piemēram, lapas izmēru, piemales, galvenes/kājenes, vairāku PDF dokumentu sapludināšanu un daudz ko citu. Šīs opcijas tiek nodotas failam wkhtmltopdf kā komandrindas argumenti. Šis piemērs parāda, kā programmatūras izstrādātāji var pielāgot PDF ģenerēšanas procesu Python lietojumprogrammās.
Kā pielāgot PDF ģenerēšanas procesu, izmantojot Python API?
import pdfkit
options = {
'page-size': 'A4',
'margin-top': '0mm',
'margin-right': '0mm',
'margin-bottom': '0mm',
'margin-left': '0mm',
}
pdfkit.from_file("source.html", "output.pdf", options=options)
Pārveidojiet HTML uz PDF, izmantojot Python bibliotēku
Atvērtā pirmkoda Python-PDFKit bibliotēka ir ļoti viegli lietojama bibliotēka HTML dokumentu ielādei un konvertēšanai PDF failos Python lietojumprogrammās. Papildus PDF failu ģenerēšanai bibliotēka var tieši pārvērst HTML saturu PDF formātā, nesaglabājot starpposma failu. Tas var būt noderīgi, strādājot ar dinamisku saturu vai ģenerējot PDF failus lidojumā. Zemāk ir vienkāršs piemērs, kas parāda, kā datorprogrammētāji var pārvērst HTML dokumentus PDF failos Python lietojumprogrammās.
Kā pārvērst HTML dokumentus PDF failos, izmantojot Python?
import pdfkit
html_string = "Hello, PDFKit!
"
pdf_bytes = pdfkit.from_string(html_string, False)
# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
f.write(pdf_bytes)