Créer, modifier et convertir PDF à Images par Python API

Le Python libre API pour la création, l'édition et la conversion de PDF images et vice versa. Merge/plit convertir PDF en texte, Rotate/Trim/Crop PDFs.

PDF est une bibliothèque Python très utile qui fournit une fonctionnalité complète liée à la création et à la gestion de PDF documents. La bibliothèque est très stable et peut être facilement exploitée sur MacOS (Of X). PDF est très facile à utiliser et donne aux utilisateurs la capacité de gérer leurs PDF fichiers et tout ce qu'ils pourraient vouloir faire à PDF est un simple clic.

La bibliothèque est très riche en caractéristiques et comporte plusieurs éléments importants liés à la manipulation de documents, tels que PDF documents de conversion à PDF, fusion ou fractionnement de PDF documents. Les scénarios PDF sont des sources ouvertes entièrement libres pour tout projet et peuvent être adaptés de toute façon.

En bref

Un aperçu des caractéristiques PDF.

Présentation des fonctionnalités

Créer un PDF
Trim PDF Pages
PDF à Images
PDF au texte
Image à PDF
Fractionner des PDF
Fusionner des PDF
PDF rotation
Graphiques de tirage
Ajouter des formes
Rote PDFs
Incorporation de polices
Crypter le PDF
Incorporer des images
PDF Pages en images
Métadonnées lisibles

PDF

PDF appuie le format PDF fichiers ainsi que les formats standard de l'industrie pour l'exportation.

Lecteur

Écrivain

TXT, HTML, PNG, JPEG, TIFF

PDF

Indépendance de la plate-forme

PDF est testé avec Python 3.0 et plus.

Python 3,0 plus élevé

PDF

Pour commencer avec PDF

Pour fonctionner en format PDF, vous devez d'abord installer le python 3 et la bibliothèque de pyobjc, et ensuite, dans le terminal, tapez le commandement et le retour de presse suivants.

Installer le pyobjc par tuyau

 pip3 install pyobjc

Il est également possible d'installer la bibliothèque manuellement ; téléchargez les derniers fichiers de version directement depuis le référentiel GitHub.

Convertir PDF à Image Autres formes

Le PDF a incorporé une fonctionnalité complète pour convertir PDF documents en divers formats de fichiers d'images. Elle fournit des formats NG, JPEG, Diff et d'autres fichiers d'images populaires. Il est également possible de créer une image manuelle à partir de chaque page des PDF documents fournis avec facilité. Une fois le processus terminé, vous devez attribuer un nom distinct à chaque dossier et le sauvegarder sur le disque. Elle appuie également la modification de la résolution, de la transparence et d'autres paramètres. Il est également possible de convertir PDF fichiers en textes et autres formats de fichiers.

Combiner plusieurs PDF fichiers à l'aide de scénarios Python

Avez-vous déjà été dans une situation où il est nécessaire de combiner PDF documents différents pour créer un nouveau fichier PDF? Les organisations doivent souvent fusionner plusieurs PDF dossiers en un seul document. La bibliothèque de PDF permet à ses utilisateurs de combiner plusieurs PDF documents en un seul et quelques lignes de code Python. Il ajoute également une table d'entrée des matières pour chaque fichier de composants. La bibliothèque appuie également la division de PDF documents importants en plus petits à l'intérieur des pommes Python.

Merge Multiple de PDF fichiers par Python API

def merge(filename):
	writeContext = None
	shortName = os.path.splitext(filename)[0]
	outFilename = shortName + "+wm.pdf"
	metaDict = getDocInfo(filename)
	writeContext = createOutputContextWithPath(outFilename, metaDict)
	readPDF = createPDFDocumentWithPath(filename)
	mergePDF = createPDFDocumentWithPath(watermark)
	if writeContext != None and readPDF != None:
		numPages = Quartz.CGPDFDocumentGetNumberOfPages(readPDF)
		for pageNum in range(1, numPages + 1):	
			page = Quartz.CGPDFDocumentGetPage(readPDF, pageNum)
			mergepage = Quartz.CGPDFDocumentGetPage(mergePDF, 1)
			if page:
				mediaBox = Quartz.CGPDFPageGetBoxRect(page, Quartz.kCGPDFMediaBox)
				if Quartz.CGRectIsEmpty(mediaBox):
					mediaBox = None			
				Quartz.CGContextBeginPage(writeContext, mediaBox)	
				Quartz.CGContextSetBlendMode(writeContext, Quartz.kCGBlendModeOverlay)
				Quartz.CGContextDrawPDFPage(writeContext, page)
				Quartz.CGContextDrawPDFPage(writeContext, mergepage)
				Quartz.CGContextEndPage(writeContext)
		Quartz.CGPDFContextClose(writeContext)
		del writeContext
	else:
		print ("A valid input file and output file must be supplied.")
		sys.exit(1)
if __name__ == "__main__":
	for filename in sys.argv[1:]:
		merge(filename)

Convertir PDF fichiers dans le fichier texte par Python

La bibliothèque de la source ouverte PDF comporte plusieurs éléments importants pour la conversion de PDF documents en de nombreux formats de fichiers de soutien. Une caractéristique importante consiste à convertir le contenu textuel d'un fichier PDF en un fichier de texte externe et à le sauvegarder au lieu de votre choix. Il est également possible de sauvegarder chaque page des PDF documents en tant que fichier distinct et de le sauvegarder avec un nom différent.

Convertir PDF documents à texte par Python API

import os, sys
from Quartz import PDFDocument
from CoreFoundation import (NSURL, NSString)
# Can't seem to import this constant, so manually creating it.
NSUTF8StringEncoding = 4
def main():
	for filename in sys.argv[1:]:	
		shortName = os.path.splitext(filename)[0]
		outputfile = shortName+" text.txt"
		pdfURL = NSURL.fileURLWithPath_(filename)
		pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
		if pdfDoc :
			pdfString = NSString.stringWithString_(pdfDoc.string())
			pdfString.writeToFile_atomically_encoding_error_(outputfile, True, NSUTF8StringEncoding, None)
if __name__ == "__main__":
   main()

Rotate, Trim, culture PDFs ou Pages dans les Apps Python

La bibliothèque PDF a inclus plusieurs fonctionnalités importantes pour traiter facilement PDF dossiers. Il permet aux programmateurs de tourner, de couper, de récolter, d'étain, de marquer l'eau, d'élever PDF documents dans leur propre application Python. Il a fourni deux façons de roter une page de PDF ou de remplir le dossier. La première consiste à créer un nouveau contexte de PDF, à transformer graphiquement chaque page de l'original et à sauvegarder le fichier. Deuxièmement, vous devez simplement ajuster le paramètre « rotation » à chaque page et c'est là.

Comment trimir PDF dossiers par Python API

import sys
import os
from Quartz import PDFDocument, kPDFDisplayBoxMediaBox, kPDFDisplayBoxTrimBox, CGRectEqualToRect
from CoreFoundation import NSURL
mediabox = kPDFDisplayBoxMediaBox
trimbox = kPDFDisplayBoxTrimBox
def trimPDF(filename):
	hasBeenChanged = False
	# filename = filename.decode('utf-8')
	shortName = os.path.splitext(filename)[0]
	outFilename = shortName + " TPS.pdf"
	pdfURL = NSURL.fileURLWithPath_(filename)
	pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
	if pdfDoc:
		pages = pdfDoc.pageCount()
		for p in range(0, pages):
			page = pdfDoc.pageAtIndex_(p)
			mediaBoxSize = page.boundsForBox_(mediabox)
			trimBoxSize = page.boundsForBox_(trimbox)
			if not CGRectEqualToRect(mediaBoxSize, trimBoxSize):
				page.setBounds_forBox_(trimBoxSize, mediabox)
				hasBeenChanged = True
		if hasBeenChanged:
			pdfDoc.writeToFile_(outFilename)
if __name__ == '__main__':
	for filename in sys.argv[1:]:
		trimPDF(filename)