1. Produtos
  2.   PDF
  3.   Python
  4.   Python-PDFKit
 
  

Gere e gerencie documentos PDF por meio da API Python gratuita

Biblioteca Python de código aberto para criar e personalizar arquivos PDF, mesclar vários PDFs e extrair texto de PDF. Ele usa Wkhtmltopdf Python Wrapper para converter HTML em PDF.

Python é há muito tempo uma linguagem preferida para desenvolvedores de software e cientistas de dados devido à sua simplicidade e versatilidade. Uma das muitas vantagens do Python é seu rico ecossistema de bibliotecas que cobrem vários domínios. Uma dessas bibliotecas é Python-PDFKit, uma ferramenta poderosa para manipulação de PDF em Python. Se você precisa gerar PDFs, extrair informações de arquivos existentes ou até mesmo converter conteúdo HTML em PDF, o Python-PDFKit tem o que você precisa. A biblioteca é muito fácil de manusear e permite que os usuários gerem PDFs a partir de HTML, URL ou strings HTML brutas de forma integrada.

Python-PDFKit é um wrapper Python para a popular ferramenta de conversão de PDF, wkhtmltopdf, que é escrita em C++. Com esta biblioteca, os desenvolvedores podem integrar facilmente a geração e manipulação de PDF em seus aplicativos Python. Existem vários recursos importantes na biblioteca para lidar com documentos PDF por meio da criação de PDFs a partir de arquivos HTML, criação de PDFs a partir de URLs, personalização do processo de geração de PDF, conversão direta de conteúdo HTML em PDF, mesclagem de vários documentos PDF em um único arquivo, gerenciamento de arquivos PDF. /rodapés, configuração do tamanho da página PDF e muito mais.

A biblioteca Python-PDFKit fornece uma interface intuitiva e direta para interagir com a ferramenta de linha de comando wkhtmltopdf subjacente, permitindo que os desenvolvedores de software criem, mesclem e convertam documentos PDF sem esforço. Suas inúmeras opções de configuração permitem o ajuste fino da saída PDF de acordo com requisitos específicos. Com seu processo de instalação fácil e uso direto, Python-PDFKit é uma adição valiosa ao kit de ferramentas de qualquer desenvolvedor. Concluindo, Python-PDFKit é uma biblioteca obrigatória para qualquer desenvolvedor Python que deseja agilizar as tarefas de geração de PDF e produzir documentos com aparência profissional com facilidade.

Previous Next

Introdução ao Python-PDFKit

A maneira recomendada e mais fácil de instalar o Python-PDFKit é usando pip. Use o seguinte comando para uma instalação tranquila.

Instale o Python-PDFKit  via pip

 pip install pdfkit 

Você também pode instalá-lo manualmente; baixe os arquivos da versão mais recente diretamente do repositório GitHub.

Extrair texto de PDF via Python

A biblioteca Python-PDFKit oferece capacidade para extrair texto programaticamente de arquivos PDF via Python. Não é fácil recuperar dados de um arquivo PDF porque a forma como o PDF armazena informações apenas dificulta sua obtenção. O Python-PDFKit facilita o trabalho dos desenvolvedores, fornecendo-lhes funções integradas fáceis de usar para recuperar informações. Eles podem usar o método extractText() no objeto de página para obter o conteúdo de texto da página.

Extrair texto de PDF via Python

 // extract text from a PDF
  from Python-PDFKit import PdfReader
  reader = PdfReader("example.pdf")
  page = reader.pages[0]
  print(page.extract_text()) 

Gerando documentos PDF via API Python

A biblioteca Python-PDFKit de código aberto facilita aos desenvolvedores de software a geração de arquivos PDF dentro de seus aplicativos Python. A biblioteca oferece suporte para geração de PDFs de diversas fontes. A biblioteca permite que desenvolvedores de software criem PDFs a partir de arquivos HTML, strings ou até mesmo URLs. Também é possível adicionar imagens, cabeçalhos e rodapés, definir tamanho de página, definir margens e assim por diante dentro de aplicativos Python. O exemplo a seguir demonstra como os desenvolvedores de software podem gerar arquivos PDF de várias fontes com apenas algumas linhas de código Python.

Gere um PDF a partir de um arquivo HTML, string ou URL via API Python

import pdfkit

# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")

# Generate a PDF from an HTML string
html_string = "

Hello, PDFKit!

" pdfkit.from_string(html_string, "output.pdf") # Generate a PDF from a URL pdfkit.from_url("https://example.com", "output.pdf")

Personalizando a geração de PDF em aplicativos Python

A biblioteca Python-PDFKit de código aberto permite que desenvolvedores de software personalizem o processo de geração de PDF dentro de seus próprios aplicativos. Os desenvolvedores de software podem especificar várias opções, como tamanho de página, margens, cabeçalhos/rodapés, mesclar vários documentos PDF e muito mais. Essas opções são passadas para wkhtmltopdf como argumentos de linha de comando. O exemplo a seguir mostra como os desenvolvedores de software podem personalizar o processo de geração de PDF dentro de aplicativos Python.

Como personalizar o processo de geração de PDF via API Python?

 import pdfkit

options = {
    'page-size': 'A4',
    'margin-top': '0mm',
    'margin-right': '0mm',
    'margin-bottom': '0mm',
    'margin-left': '0mm',
}

pdfkit.from_file("source.html", "output.pdf", options=options)

Converta HTML em PDF por meio da biblioteca Python

A biblioteca Python-PDFKit de código aberto é muito fácil de usar para carregar e converter documentos HTML em arquivos PDF dentro de seus aplicativos Python. Além de gerar PDFs, a biblioteca pode converter conteúdo HTML em PDF diretamente, sem salvar um arquivo intermediário. Isso pode ser útil ao lidar com conteúdo dinâmico ou gerar PDFs dinamicamente. Abaixo está um exemplo simples que mostra como os programadores de computador podem converter documentos HTML em arquivos PDF dentro de aplicativos Python.

 

Como converter documentos HTML em arquivos PDF via Python?

import pdfkit

html_string = "

Hello, PDFKit!

" pdf_bytes = pdfkit.from_string(html_string, False) # Save the PDF bytes to a file with open("output.pdf", "wb") as f: f.write(pdf_bytes)
 Português