Gin agus Bainistigh Doiciméid PDF trí API Python Saor in Aisce
Leabharlann Foinse Oscailte Python chun comhaid PDF a chruthú agus a shaincheapadh, comhaid PDF iolracha a chumasc & téacs a bhaint as PDF. Úsáideann sé Wkhtmltopdf Python Wrapper chun HTML a Thiontú go PDF.
Is fada an teanga í Python d’fhorbróirí bogearraí agus d’eolaithe sonraí mar gheall ar a simplíocht agus a solúbthacht. Ceann de na buntáistí iomadúla a bhaineann le Python ná a éiceachóras saibhir de leabharlanna a chlúdaíonn réimsí éagsúla. Leabharlann amháin den sórt sin is ea Python-PDFKit, uirlis chumhachtach chun PDF a ionramháil i Python. Cibé an gá duit PDFanna a ghiniúint, faisnéis a bhaint as na cinn atá ann cheana féin, nó fiú ábhar HTML a thiontú go PDF, tá Python-PDFKit clúdaithe agat. Tá an leabharlann an-éasca le láimhseáil agus cuireann sé ar chumas úsáideoirí PDFanna a ghiniúint ó HTML, URL, nó teaghráin HTML amh.
Is fillteán Python é Python-PDFKit don uirlis tiontaithe PDF a bhfuil an-tóir uirthi, wkhtmltopdf, atá scríofa in C++. Leis an leabharlann seo, is féidir le forbróirí giniúint agus ionramháil PDF a chomhtháthú go héasca ina bhfeidhmchláir Python. Tá roinnt gnéithe tábhachtacha mar chuid den leabharlann chun doiciméid PDF a láimhseáil trí chomhaid PDF a chruthú ó chomhaid HTML, PDFs a chruthú ó URLanna, an próiseas giniúna PDF a shaincheapadh, ábhar HTML a thiontú go PDF go díreach, iliomad doiciméad PDF a chumasc i gcomhad amháin, cloisteáil PDF a bhainistiú. /footers, méid an leathanaigh PDF a shocrú agus go leor eile.
Cuireann leabharlann Python-PDFKit comhéadan iomasach simplí ar fáil chun idirghníomhú leis an uirlis bhun-orduithe wkhtmltopdf, rud a chuireann ar chumas forbróirí bogearraí doiciméid PDF a chruthú, a chumasc agus a thiontú gan stró. Cumasaíonn a roghanna cumraíochta iomadúla an t-aschur PDF a mhionchoigeartú de réir riachtanais shonracha. Leis an bpróiseas suiteála éasca agus le húsáid dhíreach, cuireann Python-PDFKit go mór le foireann uirlisí aon fhorbróra. Mar fhocal scoir, is leabharlann nach mór triail a bhaint as Python-PDFKit d'aon fhorbróir Python atá ag iarraidh tascanna giniúna PDF a shruthlíniú agus doiciméid a bhfuil cuma ghairmiúil orthu a tháirgeadh gan stró.
Ag Tosú le Python-PDFKit
Is é an bealach molta agus is éasca chun Python-PDFKit a shuiteáil ná pip a úsáid. Úsáid an t-ordú seo a leanas le suiteáil mhín.
Suiteáil Python-PDFKit trí pip
pip install pdfkit
Is féidir leat é a shuiteáil de láimh freisin; íoslódáil na comhaid eisithe is déanaí go díreach ó GitHub stór.
Sliocht Téacs ó PDF trí Python
Cuireann leabharlann Python-PDFKit cumas ar fáil chun téacs a bhaint as comhaid PDF go ríomhchláraithe trí Python. Níl sé éasca sonraí a aisghabháil ó chomhad PDF mar go mbíonn sé deacair é a bhaint amach toisc go stórálann PDF faisnéis. Leis an Python-PDFKit is furasta d’fhorbróirí post a dhéanamh trí fheidhmeanna ionsuite atá éasca le húsáid a sholáthar dóibh chun faisnéis a aisghabháil. Is féidir leo an modh extractText() ar an oibiacht leathanaigh a úsáid chun ábhar téacs an leathanaigh a fháil.
Sliocht Téacs ó PDF trí Python
// extract text from a PDF
from Python-PDFKit import PdfReader
reader = PdfReader("example.pdf")
page = reader.pages[0]
print(page.extract_text())
Doiciméid PDF á nginiúint trí Python API
Cuidíonn leabharlann foinse oscailte Python-PDFKit d’fhorbróirí bogearraí comhaid PDF a ghiniúint gan stró laistigh dá bhfeidhmchláir Python. Tá tacaíocht tugtha ag an leabharlann chun PDFanna a ghiniúint ó fhoinsí éagsúla. Ceadaíonn an leabharlann d'fhorbróirí bogearraí PDFs a chruthú ó chomhaid HTML, teaghráin, nó fiú URLanna. Is féidir freisin íomhánna, ceanntásca agus buntásc a chur leis, méid an leathanaigh a shocrú, corrlaigh a shocrú agus mar sin de taobh istigh d'fheidhmchláir Python. Léiríonn an sampla seo a leanas, conas is féidir le forbróirí bogearraí comhaid PDF a ghiniúint ó fhoinsí éagsúla le cúpla líne cód Python.
Gin PDF ó Chomhad HTML, Teaghrán nó URL trí Python API
import pdfkit
# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")
# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!
"
pdfkit.from_string(html_string, "output.pdf")
# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")
Giniúint PDF a shaincheapadh in Aipeanna Python
Cuireann leabharlann foinse oscailte Python-PDFKit ar chumas forbróirí bogearraí an próiseas giniúna PDF a shaincheapadh laistigh dá bhfeidhmchláir féin. Is féidir le forbróirí bogearraí roghanna éagsúla a shonrú ar nós méid an leathanaigh, corrlaigh, ceanntásca/buntásca, iliomad doiciméad PDF a chumasc agus tuilleadh. Cuirtear na roghanna seo ar aghaidh go wkhtmltopdf mar argóintí ordú-líne. Léiríonn an sampla seo a leanas conas is féidir le forbróirí bogearraí próiseas giniúna PDF a shaincheapadh laistigh d’fheidhmchláir Python.
Conas Próiseas Giniúint PDF a Chur in oiriúint trí Python API?
import pdfkit
options = {
'page-size': 'A4',
'margin-top': '0mm',
'margin-right': '0mm',
'margin-bottom': '0mm',
'margin-left': '0mm',
}
pdfkit.from_file("source.html", "output.pdf", options=options)
Tiontaigh HTML go PDF trí Leabharlann Python
Is leabharlann an-éasca le húsáid í an leabharlann foinse oscailte Python-PDFKit chun doiciméid HTML a luchtú agus a thiontú go comhaid PDF laistigh dá bhfeidhmchláir Python. Seachas PDFanna a ghiniúint, is féidir leis an leabharlann ábhar HTML a thiontú go PDF go díreach gan comhad idirmheánach a shábháil. Is féidir é seo a bheith úsáideach agus tú ag déileáil le hábhar dinimiciúil nó ag giniúint PDFanna ar an eitilt. Seo thíos sampla simplí a thaispeánann conas is féidir le ríomhchláraitheoirí ríomhairí doiciméid HTML a thiontú go comhaid PDF taobh istigh d’iarratais Python.
Conas Doiciméid HTML a Thiontú go Comhaid PDF trí Python?
import pdfkit
html_string = "Hello, PDFKit!
"
pdf_bytes = pdfkit.from_string(html_string, False)
# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
f.write(pdf_bytes)