1. Produse
  2.   PDF
  3.   Python
  4.   PDFsuite
 
  

Creați, editați și convertiți PDF la imagini prin Python API

Python API gratuit pentru crearea, editarea și transformarea PDF în imagini și invers. Convertiți PDF în text, Rotate/Trim/Crop PDFs.

PDFsuite este o bibliotecă Python foarte utilă care oferă funcționalități complete legate de crearea și gestionarea documentelor PDF . Biblioteca este foarte stabilă și poate fi ușor de utilizat pe MacOS (din X). PDFsuite este foarte ușor de utilizat și oferă utilizatorilor posibilitatea de a-și gestiona cele PDF de fișiere și tot ce ar putea dori să facă la PDF este doar un clic distanță.

Biblioteca este foarte bogată în caracteristici și a inclus mai multe caracteristici importante legate de manipularea PDF de documente, cum ar fi PDF de documente de conversie, inscripție de acces la PDF de pagini. Scripturile PDF sunt complet gratuite pentru utilizare în orice fel de proiect și pot fi adaptate în orice mod.

Previous Next

Începe cu PDF-uri

Pentru a rula PDF-uri, mai întâi trebuie să instalați Python 3 și biblioteca piobjc, iar după aceea, în Terminal, vă rugăm să introduceți următoarea comandă și returnarea presei.

Instalează piobjc prin pipă

 pip3 install pyobjc 

De asemenea, este posibilă instalarea manuală a bibliotecii; descărcați cele mai recente fișiere de lansare direct din depozitul GitHub.

Convertire PDF în imagine și alte formate

Suita a încorporat funcționalitatea completă pentru transformarea a PDF de documente în diferite formate de fișiere de imagine. Acesta oferă NG, JPEG, Diff și alte formate populare de fișiere de imagine. De asemenea, este posibil să se creeze o imagine de la fiecare pagină a celor PDF de documente furnizate cu ușurință. Odată ce procesul este complet, trebuie să atribuiți un nume separat fiecărui fișier și să îl salvați pe disc. De asemenea, sprijină modificarea rezoluției, a transparenței și a altor parametri. De asemenea, este posibil să convertiți PDF de fișiere în text și alte formate de fișiere.

Combinați PDF fișiere folosind scripturi Python

Ai fost vreodată într-o situație în care este necesar să combine diferite PDF de documente pentru a crea un nou fișier PDF? Organizațiile necesită adesea fuzionarea mai multor PDF fișiere într-un singur document. Biblioteca PDFsuite face ușor pentru utilizatorii săi să combine mai multe PDF de documente într-unul singur, cu doar câteva linii de cod Python. De asemenea, adaugă un tabel de conținut pentru fiecare fișier componente. Biblioteca sprijină, de asemenea, împărțirea a PDF de documente mari în cele mai mici din aplicațiile Python.

PDF Fișiere multiple prin Python API

def merge(filename):
	writeContext = None
	shortName = os.path.splitext(filename)[0]
	outFilename = shortName + "+wm.pdf"
	metaDict = getDocInfo(filename)
	writeContext = createOutputContextWithPath(outFilename, metaDict)
	readPDF = createPDFDocumentWithPath(filename)
	mergePDF = createPDFDocumentWithPath(watermark)
	if writeContext != None and readPDF != None:
		numPages = Quartz.CGPDFDocumentGetNumberOfPages(readPDF)
		for pageNum in range(1, numPages + 1):	
			page = Quartz.CGPDFDocumentGetPage(readPDF, pageNum)
			mergepage = Quartz.CGPDFDocumentGetPage(mergePDF, 1)
			if page:
				mediaBox = Quartz.CGPDFPageGetBoxRect(page, Quartz.kCGPDFMediaBox)
				if Quartz.CGRectIsEmpty(mediaBox):
					mediaBox = None			
				Quartz.CGContextBeginPage(writeContext, mediaBox)	
				Quartz.CGContextSetBlendMode(writeContext, Quartz.kCGBlendModeOverlay)
				Quartz.CGContextDrawPDFPage(writeContext, page)
				Quartz.CGContextDrawPDFPage(writeContext, mergepage)
				Quartz.CGContextEndPage(writeContext)
		Quartz.CGPDFContextClose(writeContext)
		del writeContext
	else:
		print ("A valid input file and output file must be supplied.")
		sys.exit(1)
if __name__ == "__main__":
	for filename in sys.argv[1:]:
		merge(filename)

Transformă PDF de fișiere în fișier text

Biblioteca open source PDFsuite a inclus mai multe caracteristici importante pentru conversia a PDF de documente în numeroase formate de fișiere de suport. O caracteristică importantă este transformarea conținutului text al unui fișier text dintr-un fișier text extern și salvarea acestuia la locul de alegere. De asemenea, este posibil să salvați fiecare pagină a celor PDF de documente ca fișier separat și să o salvați cu un nume diferit.

Transformă PDF de documente în fișier text via Python API

import os, sys
from Quartz import PDFDocument
from CoreFoundation import (NSURL, NSString)
# Can't seem to import this constant, so manually creating it.
NSUTF8StringEncoding = 4
def main():
	for filename in sys.argv[1:]:	
		shortName = os.path.splitext(filename)[0]
		outputfile = shortName+" text.txt"
		pdfURL = NSURL.fileURLWithPath_(filename)
		pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
		if pdfDoc :
			pdfString = NSString.stringWithString_(pdfDoc.string())
			pdfString.writeToFile_atomically_encoding_error_(outputfile, True, NSUTF8StringEncoding, None)
if __name__ == "__main__":
   main()

Rotație, Trim, Cultură PDFs sau pagini în aplicații Python

Biblioteca PDFsuite a inclus mai multe funcționalități importante pentru manipularea cu ușurință a PDF de fișiere. Acesta permite programatorilor să se rotească, să trimită, să cultive, nuanță, watermark, scală și să ridice PDF de documente în propria aplicație Python. Acesta a oferit două moduri de a roti o pagină PDF sau un fișier complet. Primul este de a crea un nou context PDF, de a transforma grafic fiecare pagină a originalului și de a salva fișierul. În al doilea rând, trebuie doar să ajustați parametrul „rotation” pe fiecare pagină și asta este.

 

Cum să trimiți PDF fișiere prin Python API

import sys
import os
from Quartz import PDFDocument, kPDFDisplayBoxMediaBox, kPDFDisplayBoxTrimBox, CGRectEqualToRect
from CoreFoundation import NSURL
mediabox = kPDFDisplayBoxMediaBox
trimbox = kPDFDisplayBoxTrimBox
def trimPDF(filename):
	hasBeenChanged = False
	# filename = filename.decode('utf-8')
	shortName = os.path.splitext(filename)[0]
	outFilename = shortName + " TPS.pdf"
	pdfURL = NSURL.fileURLWithPath_(filename)
	pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
	if pdfDoc:
		pages = pdfDoc.pageCount()
		for p in range(0, pages):
			page = pdfDoc.pageAtIndex_(p)
			mediaBoxSize = page.boundsForBox_(mediabox)
			trimBoxSize = page.boundsForBox_(trimbox)
			if not CGRectEqualToRect(mediaBoxSize, trimBoxSize):
				page.setBounds_forBox_(trimBoxSize, mediabox)
				hasBeenChanged = True
		if hasBeenChanged:
			pdfDoc.writeToFile_(outFilename)
if __name__ == '__main__':
	for filename in sys.argv[1:]:
		trimPDF(filename)
 Română