Criar, Editar e converter PDF para imagens via Python API

Python API livre para, editar e converter PDF para imagens e vice-versa. Merge/split & converter PDF para texto, Rotate /Trim/Crop PDFs.

PDFsuite é uma biblioteca Python muito que uma completa à criação e à gestão de PDF documentos. A biblioteca é muito e pode ser facilmente executada em MacOS (Of X). PDFsuite é muito fácil de usar e dá aos usuários a de gerenciar seus PDF arquivos e tudo o que eles fazer a um PDF é apenas um clique de.

A biblioteca é muito rica em recursos e inclui vários recursos importantes relacionados ao manuseio de documentos PDF, como conversão de documentos PDF em PDF, mesclagem ou divisão de documentos PDF, conversão de imagens em PDF, rotação de PDF, adição de números de página a PDF, inserção de marcas d'água em PDFs, desenhe gráficos em PDFs, aplique filtros de quartzo a PDFs, acesse e leia metadados, exporte páginas PDF como imagens, conte páginas em PDF e muito mais. Os scripts PDFsuite são de código aberto e totalmente gratuitos para uso em qualquer tipo de projeto e podem ser adaptados de qualquer forma.

Num relance

Uma visão geral dos recursos PDFsuite.

Visão geral dos recursos

Criar PDF
Trim PDF Páginas
PDF para Imagens
PDF para texto
Imagem para PDF
PDFs divididos
Mesclar PDFs
PDF rotação
Desenhe
Adicionar formas
Roda PDFs
Incorporação de fontes
Criptografar PDF
Incorporando imagens
PDF Páginas como imagens
Leia metadados

PDFsuite

PDFsuite PDF formato de arquivo, bem como padrão da indústria para.

Leitor

Escritor

TXT, HTML, PNG, JPEG, TIFF

PDFsuite

Independência da plataforma

PDFsuite é testado com Python 3.0 e superior.

Python 3.0 & superior

PDFsuite

Começando com PDFsuite

Para PDFsuite primeiro você precisa instalar python 3 e a biblioteca pyobjc, e depois disso no Terminal por favor digite o seguinte comando e pressione Return.

Instalar pyobjc via pip

 pip3 install pyobjc

Também é possível instalar a biblioteca manualmente; baixe os arquivos de lançamento mais recentes diretamente do repositório GitHub.

Converter PDF para imagem e outros

O PDFsuite completa para converter PDF documentos para vários de arquivos de imagem. Ele NG, JPEG, Diff e outros de arquivos de imagem populares. é possível uma imagem de batman de cada página dos PDF documentos com. Uma vez que o processo é completo, você precisa atribuir um nome a cada arquivo e -lo no disco. Ela também envolve alterar os, e outros. é possível converter PDF arquivos para texto e outros de arquivo.

Combine vários PDF arquivos usando Python Scripts

Você já em uma onde é necessário diferentes PDF documentos para um novo PDF ? As muitas vezes requerem a de múltiplos PDF arquivos em um único documento. A biblioteca PDFsuite torna mais fácil para seus usuários vários PDF documentos em um único com apenas algumas de código Python. Ele também adiciona uma de entrada de conteúdo para cada arquivo de componentes. A biblioteca também totalmente dividir PDF documentos grandes em aplicativos Python menores.

Mesclar vários arquivos PDF via Python API

def merge(filename):
	writeContext = None
	shortName = os.path.splitext(filename)[0]
	outFilename = shortName + "+wm.pdf"
	metaDict = getDocInfo(filename)
	writeContext = createOutputContextWithPath(outFilename, metaDict)
	readPDF = createPDFDocumentWithPath(filename)
	mergePDF = createPDFDocumentWithPath(watermark)
	if writeContext != None and readPDF != None:
		numPages = Quartz.CGPDFDocumentGetNumberOfPages(readPDF)
		for pageNum in range(1, numPages + 1):	
			page = Quartz.CGPDFDocumentGetPage(readPDF, pageNum)
			mergepage = Quartz.CGPDFDocumentGetPage(mergePDF, 1)
			if page:
				mediaBox = Quartz.CGPDFPageGetBoxRect(page, Quartz.kCGPDFMediaBox)
				if Quartz.CGRectIsEmpty(mediaBox):
					mediaBox = None			
				Quartz.CGContextBeginPage(writeContext, mediaBox)	
				Quartz.CGContextSetBlendMode(writeContext, Quartz.kCGBlendModeOverlay)
				Quartz.CGContextDrawPDFPage(writeContext, page)
				Quartz.CGContextDrawPDFPage(writeContext, mergepage)
				Quartz.CGContextEndPage(writeContext)
		Quartz.CGPDFContextClose(writeContext)
		del writeContext
	else:
		print ("A valid input file and output file must be supplied.")
		sys.exit(1)
if __name__ == "__main__":
	for filename in sys.argv[1:]:
		merge(filename)

Converter PDF arquivos em Text File via Python

A biblioteca open source PDFsuite vários recursos importantes para PDF conversão de documentos para de arquivos de suporte. Uma importante é converter o conteúdo de texto de um arquivo PDF em um arquivo de texto externo e guardá-lo para o lugar de sua. é possível salvar cada página dos PDF documentos como um arquivo e -lo com um nome diferente.

Converter PDF documentos para arquivo de texto via Python API

import os, sys
from Quartz import PDFDocument
from CoreFoundation import (NSURL, NSString)
# Can't seem to import this constant, so manually creating it.
NSUTF8StringEncoding = 4
def main():
	for filename in sys.argv[1:]:	
		shortName = os.path.splitext(filename)[0]
		outputfile = shortName+" text.txt"
		pdfURL = NSURL.fileURLWithPath_(filename)
		pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
		if pdfDoc :
			pdfString = NSString.stringWithString_(pdfDoc.string())
			pdfString.writeToFile_atomically_encoding_error_(outputfile, True, NSUTF8StringEncoding, None)
if __name__ == "__main__":
   main()

Rotate, Trim, Recorte PDFs ou Páginas em Apps Python

A biblioteca PDFsuite incluiu várias funcionalidades importantes para manusear facilmente PDF arquivos. Ele permite que os programadores girar, cortar, cortar, tintar, marca d'água, escala e subir PDF documentos dentro de sua Python. Ele forneceu duas de girar uma PDF página ou arquivo completo. O primeiro é um novo PDF contexto, transformar graficamente cada página do original e salvar o arquivo. Em segundo lugar, você só precisa o 'rotação' em cada página e é isso.

Como PDF arquivos via Python API

import sys
import os
from Quartz import PDFDocument, kPDFDisplayBoxMediaBox, kPDFDisplayBoxTrimBox, CGRectEqualToRect
from CoreFoundation import NSURL
mediabox = kPDFDisplayBoxMediaBox
trimbox = kPDFDisplayBoxTrimBox
def trimPDF(filename):
	hasBeenChanged = False
	# filename = filename.decode('utf-8')
	shortName = os.path.splitext(filename)[0]
	outFilename = shortName + " TPS.pdf"
	pdfURL = NSURL.fileURLWithPath_(filename)
	pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
	if pdfDoc:
		pages = pdfDoc.pageCount()
		for p in range(0, pages):
			page = pdfDoc.pageAtIndex_(p)
			mediaBoxSize = page.boundsForBox_(mediabox)
			trimBoxSize = page.boundsForBox_(trimbox)
			if not CGRectEqualToRect(mediaBoxSize, trimBoxSize):
				page.setBounds_forBox_(trimBoxSize, mediabox)
				hasBeenChanged = True
		if hasBeenChanged:
			pdfDoc.writeToFile_(outFilename)
if __name__ == '__main__':
	for filename in sys.argv[1:]:
		trimPDF(filename)