Creați, editați și convertiți PDF la imagini prin Python API

Python API gratuit pentru crearea, editarea și transformarea PDF în imagini și invers. Convertiți PDF în text, Rotate/Trim/Crop PDFs.

PDFsuite este o bibliotecă Python foarte utilă care oferă funcționalități complete legate de crearea și gestionarea documentelor PDF . Biblioteca este foarte stabilă și poate fi ușor de utilizat pe MacOS (din X). PDFsuite este foarte ușor de utilizat și oferă utilizatorilor posibilitatea de a-și gestiona cele PDF de fișiere și tot ce ar putea dori să facă la PDF este doar un clic distanță.

Biblioteca este foarte bogată în caracteristici și a inclus mai multe caracteristici importante legate de manipularea PDF de documente, cum ar fi PDF de documente de conversie, inscripție de acces la PDF de pagini. Scripturile PDF sunt complet gratuite pentru utilizare în orice fel de proiect și pot fi adaptate în orice mod.

La O privire

O prezentare generală a caracteristicilor PDF.

Prezentare generală a caracteristicilor

Creați PDF
Trim PDF pagini
PDF pentru imagini
PDF pentru a scrie
PDF
Divizarea PDF-urilor
Îmbinați fișierele PDF
PDF rotație
Grafică desenată
Adăugați forme
Rotate PDFs
Încorporarea fontului
Criptați PDF
Încorporarea imaginilor
PDF de pagini ca imagini
Metadate

PDF-uri

PDFsuite suportă PDF formate de fișiere, precum și formate standard pentru industrie pentru export.

Cititor

Scriitor

TXT, HTML, PNG, JPEG, TIFF

PDF-uri

Independența platformei

PDFsuite este testat cu Python 3.0 și mai mare.

Python 3.0 mai sus

PDF-uri

Începe cu PDF-uri

Pentru a rula PDF-uri, mai întâi trebuie să instalați Python 3 și biblioteca piobjc, iar după aceea, în Terminal, vă rugăm să introduceți următoarea comandă și returnarea presei.

Instalează piobjc prin pipă

 pip3 install pyobjc

De asemenea, este posibilă instalarea manuală a bibliotecii; descărcați cele mai recente fișiere de lansare direct din depozitul GitHub.

Convertire PDF în imagine și alte formate

Suita a încorporat funcționalitatea completă pentru transformarea a PDF de documente în diferite formate de fișiere de imagine. Acesta oferă NG, JPEG, Diff și alte formate populare de fișiere de imagine. De asemenea, este posibil să se creeze o imagine de la fiecare pagină a celor PDF de documente furnizate cu ușurință. Odată ce procesul este complet, trebuie să atribuiți un nume separat fiecărui fișier și să îl salvați pe disc. De asemenea, sprijină modificarea rezoluției, a transparenței și a altor parametri. De asemenea, este posibil să convertiți PDF de fișiere în text și alte formate de fișiere.

Combinați PDF fișiere folosind scripturi Python

Ai fost vreodată într-o situație în care este necesar să combine diferite PDF de documente pentru a crea un nou fișier PDF? Organizațiile necesită adesea fuzionarea mai multor PDF fișiere într-un singur document. Biblioteca PDFsuite face ușor pentru utilizatorii săi să combine mai multe PDF de documente într-unul singur, cu doar câteva linii de cod Python. De asemenea, adaugă un tabel de conținut pentru fiecare fișier componente. Biblioteca sprijină, de asemenea, împărțirea a PDF de documente mari în cele mai mici din aplicațiile Python.

PDF Fișiere multiple prin Python API

def merge(filename):
	writeContext = None
	shortName = os.path.splitext(filename)[0]
	outFilename = shortName + "+wm.pdf"
	metaDict = getDocInfo(filename)
	writeContext = createOutputContextWithPath(outFilename, metaDict)
	readPDF = createPDFDocumentWithPath(filename)
	mergePDF = createPDFDocumentWithPath(watermark)
	if writeContext != None and readPDF != None:
		numPages = Quartz.CGPDFDocumentGetNumberOfPages(readPDF)
		for pageNum in range(1, numPages + 1):	
			page = Quartz.CGPDFDocumentGetPage(readPDF, pageNum)
			mergepage = Quartz.CGPDFDocumentGetPage(mergePDF, 1)
			if page:
				mediaBox = Quartz.CGPDFPageGetBoxRect(page, Quartz.kCGPDFMediaBox)
				if Quartz.CGRectIsEmpty(mediaBox):
					mediaBox = None			
				Quartz.CGContextBeginPage(writeContext, mediaBox)	
				Quartz.CGContextSetBlendMode(writeContext, Quartz.kCGBlendModeOverlay)
				Quartz.CGContextDrawPDFPage(writeContext, page)
				Quartz.CGContextDrawPDFPage(writeContext, mergepage)
				Quartz.CGContextEndPage(writeContext)
		Quartz.CGPDFContextClose(writeContext)
		del writeContext
	else:
		print ("A valid input file and output file must be supplied.")
		sys.exit(1)
if __name__ == "__main__":
	for filename in sys.argv[1:]:
		merge(filename)

Transformă PDF de fișiere în fișier text

Biblioteca open source PDFsuite a inclus mai multe caracteristici importante pentru conversia a PDF de documente în numeroase formate de fișiere de suport. O caracteristică importantă este transformarea conținutului text al unui fișier text dintr-un fișier text extern și salvarea acestuia la locul de alegere. De asemenea, este posibil să salvați fiecare pagină a celor PDF de documente ca fișier separat și să o salvați cu un nume diferit.

Transformă PDF de documente în fișier text via Python API

import os, sys
from Quartz import PDFDocument
from CoreFoundation import (NSURL, NSString)
# Can't seem to import this constant, so manually creating it.
NSUTF8StringEncoding = 4
def main():
	for filename in sys.argv[1:]:	
		shortName = os.path.splitext(filename)[0]
		outputfile = shortName+" text.txt"
		pdfURL = NSURL.fileURLWithPath_(filename)
		pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
		if pdfDoc :
			pdfString = NSString.stringWithString_(pdfDoc.string())
			pdfString.writeToFile_atomically_encoding_error_(outputfile, True, NSUTF8StringEncoding, None)
if __name__ == "__main__":
   main()

Rotație, Trim, Cultură PDFs sau pagini în aplicații Python

Biblioteca PDFsuite a inclus mai multe funcționalități importante pentru manipularea cu ușurință a PDF de fișiere. Acesta permite programatorilor să se rotească, să trimită, să cultive, nuanță, watermark, scală și să ridice PDF de documente în propria aplicație Python. Acesta a oferit două moduri de a roti o pagină PDF sau un fișier complet. Primul este de a crea un nou context PDF, de a transforma grafic fiecare pagină a originalului și de a salva fișierul. În al doilea rând, trebuie doar să ajustați parametrul „rotation” pe fiecare pagină și asta este.

Cum să trimiți PDF fișiere prin Python API

import sys
import os
from Quartz import PDFDocument, kPDFDisplayBoxMediaBox, kPDFDisplayBoxTrimBox, CGRectEqualToRect
from CoreFoundation import NSURL
mediabox = kPDFDisplayBoxMediaBox
trimbox = kPDFDisplayBoxTrimBox
def trimPDF(filename):
	hasBeenChanged = False
	# filename = filename.decode('utf-8')
	shortName = os.path.splitext(filename)[0]
	outFilename = shortName + " TPS.pdf"
	pdfURL = NSURL.fileURLWithPath_(filename)
	pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
	if pdfDoc:
		pages = pdfDoc.pageCount()
		for p in range(0, pages):
			page = pdfDoc.pageAtIndex_(p)
			mediaBoxSize = page.boundsForBox_(mediabox)
			trimBoxSize = page.boundsForBox_(trimbox)
			if not CGRectEqualToRect(mediaBoxSize, trimBoxSize):
				page.setBounds_forBox_(trimBoxSize, mediabox)
				hasBeenChanged = True
		if hasBeenChanged:
			pdfDoc.writeToFile_(outFilename)
if __name__ == '__main__':
	for filename in sys.argv[1:]:
		trimPDF(filename)