Erstellen, Bearbeiten & Konvertieren PDF zu Images über Python API

Free Python API for creating, edit and conversion PDF to images and vice versa. Fusion/split & convert PDF to text, Drehen /Trim/Crop PDFs.

PDFsuite ist eine sehr nützliche Python-Bibliothek, die vollständige Funktionalität für die Erstellung und Verwaltung von PDF Dokumenten bietet. Die Bibliothek ist sehr stabil und kann leicht unter MacOS (Of X) ausgeführt werden. PDFsuite ist sehr einfach zu benutzen und gibt den Benutzern die Möglichkeit, ihre PDF Dateien zu verwalten, und alles, was sie möglicherweise tun wollen, um PDF ist nur ein Klick entfernt.

Die Bibliothek ist sehr funktionsreich und enthält mehrere wichtige Funktionen im Zusammenhang mit der Handhabung von PDF-Dokumenten, wie z PDFs, Grafiken in PDFs zeichnen, Quarzfilter auf PDFs anwenden, auf Metadaten zugreifen und diese lesen, PDF-Seiten als Bilder exportieren, Seiten in PDFs zählen und vieles mehr. Die PDFsuite-Skripte sind Open Source, können in jeder Art von Projekt völlig kostenlos verwendet und beliebig angepasst werden.

Auf einen Blick

Ein Überblick über die Funktionen von PDFsuite.

Funktionsübersicht

PDF erzeugen
Trim PDF Seiten
PDF zu Bilder
PDF zu Text.
Bild zu PDF
PDFs teilen
PDFs zusammenführen
PDF Rotation.
Graphiken ziehen
Fügen Sie Formen hinzu
Rotate PDFs
Einbettung von Schriftarten
PDF verschlüsseln
Bilder einbetten
PDF Seiten als Bilder
Lesen Sie Metadaten.

PDFsuite.

PDFsuite unterstützt PDF Dateiformate sowie Industriestandardformate für den Export.

Leser

Schriftsteller

TXT, HTML, PNG, JPEG, TIFF

PDFsuite.

Plattformunabhängigkeit

PDFsuite wird mit Python 3.0 und höher getestet.

3.0 und höher

PDFsuite.

Starten Sie mit PDFsuite

Um PDFsuite zunächst zu installieren, müssen Sie python 3 und die pyobjc Bibliothek installieren. Danach tippen Sie im Terminal den folgenden Befehl ein und drücken die Return.

Install pyobjc via pip

 pip3 install pyobjc

Es ist auch möglich, die Bibliothek manuell zu installieren; Laden Sie die neuesten Release-Dateien direkt aus dem GitHub-Repository herunter.

Konvertierung PDF in Image & Other Formats

Die PDFsuite hat vollständige Funktionalität zur Konvertierung von PDF Dokumenten in verschiedene Bilddateiformate integriert. Es stellt NG, JPEG, Diff und andere beliebte Bilddateiformate zur Verfügung. Es ist auch möglich, ein Batman-Bild von jeder Seite der bereitgestellten PDF Dokumente mit Leichtigkeit zu erstellen. Sobald der Prozess abgeschlossen ist, müssen Sie jeder Datei einen eigenen Namen zuweisen und auf der Festplatte speichern. Es unterstützt auch die Änderung von Auflösung, Transparenz und anderen Parametern. Es ist auch möglich, PDF Dateien in Text und andere Dateiformate zu konvertieren.

Kombinieren Sie mehrere PDF Dateien mithilfe von Python Scripts

Haben Sie jemals eine Situation gehabt, in der verschiedene PDF Dokumente kombiniert werden müssen, um eine neue PDF Datei zu erstellen? Organisationen benötigen häufig das Zusammenführen mehrerer PDF Dateien in ein einziges Dokument. Die PDFsuite-Bibliothek macht es seinen Benutzern leicht, mehrere PDF Dokumente in eine einzige mit nur wenigen Zeilen Python-Code zu kombinieren. Es fügt auch eine Inhaltstabelle für jede Komponentendatei hinzu. Die Bibliothek unterstützt auch vollständig die Aufteilung großer PDF Dokumente in kleinere Dokumente in Python-Apps.

Verschmelzung mehrerer PDF Dateien über Python API

def merge(filename):
	writeContext = None
	shortName = os.path.splitext(filename)[0]
	outFilename = shortName + "+wm.pdf"
	metaDict = getDocInfo(filename)
	writeContext = createOutputContextWithPath(outFilename, metaDict)
	readPDF = createPDFDocumentWithPath(filename)
	mergePDF = createPDFDocumentWithPath(watermark)
	if writeContext != None and readPDF != None:
		numPages = Quartz.CGPDFDocumentGetNumberOfPages(readPDF)
		for pageNum in range(1, numPages + 1):	
			page = Quartz.CGPDFDocumentGetPage(readPDF, pageNum)
			mergepage = Quartz.CGPDFDocumentGetPage(mergePDF, 1)
			if page:
				mediaBox = Quartz.CGPDFPageGetBoxRect(page, Quartz.kCGPDFMediaBox)
				if Quartz.CGRectIsEmpty(mediaBox):
					mediaBox = None			
				Quartz.CGContextBeginPage(writeContext, mediaBox)	
				Quartz.CGContextSetBlendMode(writeContext, Quartz.kCGBlendModeOverlay)
				Quartz.CGContextDrawPDFPage(writeContext, page)
				Quartz.CGContextDrawPDFPage(writeContext, mergepage)
				Quartz.CGContextEndPage(writeContext)
		Quartz.CGPDFContextClose(writeContext)
		del writeContext
	else:
		print ("A valid input file and output file must be supplied.")
		sys.exit(1)
if __name__ == "__main__":
	for filename in sys.argv[1:]:
		merge(filename)

Konvertiert PDF Dateien in Textdatei über Python

Die Open Source PDFsuite Bibliothek hat einige wichtige Funktionen für die Konvertierung von PDF Dokumenten in zahlreiche unterstützen Dateiformate enthalten. Eine wichtige Funktion ist es, den Text einer PDF Datei in eine externe Textdatei zu konvertieren und an den gewünschten Ort zu speichern. Es ist auch möglich, jede Seite der PDF Dokumente als separate Datei zu speichern und sie mit einem anderen Namen zu speichern.

Konvertiert PDF Dokumente in Textdatei über Python API

import os, sys
from Quartz import PDFDocument
from CoreFoundation import (NSURL, NSString)
# Can't seem to import this constant, so manually creating it.
NSUTF8StringEncoding = 4
def main():
	for filename in sys.argv[1:]:	
		shortName = os.path.splitext(filename)[0]
		outputfile = shortName+" text.txt"
		pdfURL = NSURL.fileURLWithPath_(filename)
		pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
		if pdfDoc :
			pdfString = NSString.stringWithString_(pdfDoc.string())
			pdfString.writeToFile_atomically_encoding_error_(outputfile, True, NSUTF8StringEncoding, None)
if __name__ == "__main__":
   main()

Rotate, Trim, Crop PDFs oder Pages in Python Apps

Die PDFsuite-Bibliothek hat einige wichtige Funktionen für die einfache Handhabung von PDF Dateien enthalten. Es erlaubt Programmierern, PDF Dokumente innerhalb ihrer eigenen Python-Anwendung zu rotieren, zu schneiden, zu schneiden, zu schneiden, zu kleben, zu färben, Wasserzeichen, zu skalieren und zu erheben. Es hat zwei Möglichkeiten zur Verfügung gestellt, eine PDF-Seite oder komplette Datei zu rotieren. Der erste besteht darin, einen neuen PDF Kontext zu erstellen, jede Seite des Originals grafisch zu transformieren und die Datei zu speichern. Zweitens müssen Sie nur den 'Rotation'-Parameter auf jeder Seite anpassen, und das ist es.

How to Trim PDF Files via Python API

import sys
import os
from Quartz import PDFDocument, kPDFDisplayBoxMediaBox, kPDFDisplayBoxTrimBox, CGRectEqualToRect
from CoreFoundation import NSURL
mediabox = kPDFDisplayBoxMediaBox
trimbox = kPDFDisplayBoxTrimBox
def trimPDF(filename):
	hasBeenChanged = False
	# filename = filename.decode('utf-8')
	shortName = os.path.splitext(filename)[0]
	outFilename = shortName + " TPS.pdf"
	pdfURL = NSURL.fileURLWithPath_(filename)
	pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
	if pdfDoc:
		pages = pdfDoc.pageCount()
		for p in range(0, pages):
			page = pdfDoc.pageAtIndex_(p)
			mediaBoxSize = page.boundsForBox_(mediabox)
			trimBoxSize = page.boundsForBox_(trimbox)
			if not CGRectEqualToRect(mediaBoxSize, trimBoxSize):
				page.setBounds_forBox_(trimBoxSize, mediabox)
				hasBeenChanged = True
		if hasBeenChanged:
			pdfDoc.writeToFile_(outFilename)
if __name__ == '__main__':
	for filename in sys.argv[1:]:
		trimPDF(filename)