1. 제품
  2.   PDF
  3.   Java
  4.   Apache PDFBox  

Apache PDFBox  

 
 

PDF 문서 처리를 위한 자바 API

오픈 소스 자바 라이브러리는 자바 애플리케이션 내에서 PDF 문서를 생성, 인쇄, 분할 또는 병합할 수 있습니다.

Apache PDFBox는 PDF 문서 작업을 위한 오픈 소스 순수 Java 라이브러리입니다. 이 라이브러리를 사용하여 Java 개발자는 새 PDF 문서를 만들고 기존 PDF 문서를 쉽게 조작하는 Java 프로그램을 개발할 수 있습니다. 또한 개발자는 PDF 문서에서 콘텐츠를 읽고 추출할 수 있습니다. 이 외에도 PDFBox에는 사용 가능한 Jar 파일을 사용하여 PDF 문서에 대해 다양한 작업을 수행하기 위한 명령줄 유틸리티도 포함되어 있습니다.

PDF(Portable Document Format)는 응용 프로그램 소프트웨어, 하드웨어 및 운영 체제와 독립적인 방식으로 데이터를 표시하는 데 도움이 되는 파일 형식입니다. Apache PDFBox는 PDF 파일의 텍스트 및 메타데이터 생성, 렌더링, 인쇄, 분할, 병합, 변경, 확인 및 추출과 같은 여러 고급 기능을 지원합니다.

Previous Next

Apache PDFBox 시작하기

먼저 PDFBox 다운로드 페이지에서 최신 릴리스를 다운로드해야 합니다. PDFBox를 성공적으로 빌드하려면 Java 7 이상 및 Maven 3을 설치해야 합니다. 다음 빌드 명령 사용

설치 명령

 mvn clean instal 

이 명령어는 자바 소스를 컴파일하고 기본적으로 바이너리 클래스를 jar 패키지로 패키징합니다.

새 PDF 문서를 만들고 수정하는 Java API

Apache PDFBox를 사용하면 프로그래머가 처음부터 새 PDF 문서를 생성할 수 있습니다. 문서를 생성한 후 개발자는 문서를 원하는 위치에 저장할 수 있습니다. PDF는 오늘날 가장 일반적으로 사용되는 파일 형식 중 하나입니다. PDF 문서는 다양한 플랫폼에서 호환되며 문서를 만드는 데 사용된 하드웨어, 운영 체제 및 응용 프로그램 소프트웨어와 독립적으로 문서를 나타냅니다. PDFBox는 또한 개발자가 기존 PDF 문서를 수정할 수 있도록 합니다. 개발자는 기존 페이지 문서에 새 페이지와 텍스트를 추가할 수 있습니다.

PDF 문서 만들기 - 자바

// Create a new PDF document
PDDocument document = new PDDocument();
// Save document
document.save("fileformat.pdf");
// Close document
document.close();

Java 라이브러리를 사용하여 PDF 문서 분할 및 병합

Apache PDFBox는 여러 PDF 문서를 단일 PDF 문서로 병합하는 기능을 제공합니다. 여러 문서를 병합하려면 먼저 기존 PDF 문서를 로드한 다음 대상 파일의 경로를 설정해야 합니다. 그 후 개발자는 최종 병합된 PDF 파일에서 찾고자 하는 순서대로 모든 소스 PDF 파일을 추가할 수 있습니다. 주어진 PDF 문서를 여러 PDF 파일로 분할할 수 있습니다. 이 Splitter 클래스는 주어진 PDF 문서를 여러 개의 다른 개별 문서로 분할하는 데 사용됩니다.

PDF 문서 병합 - 자바

// Initialize PDFMergerUtility object
PDFMergerUtility pdfMergerUtility = new PDFMergerUtility();
// Set output file path
pdfMergerUtility.setDestinationFileName("merged.pdf");
// Add source documents
pdfMergerUtility.addSource(new File("document1.pdf"));
pdfMergerUtility.addSource(new File("document2.pdf"));
// Merger documents
pdfMergerUtility.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());

Java 앱 내에서 PDF 문서에 이미지 추가 및 추출

Apache PDFBox를 사용하면 Java 개발자가 기존 PDF 문서에 이미지를 삽입할 수 있습니다. 이미지는 항상 콘텐츠에 진정한 가치를 더합니다. 이미지는 우리가 배우고, 관심을 끌고, 개념을 설명하고, 영감을 주는 데 도움이 됩니다. PDFBox는 PDF 문서에 이미지를 삽입하기 위한 라이브러리를 제공합니다. 이 라이브러리는 PDF 문서에 이미지를 삽입하기 위해 Java 프로그램을 사용합니다. API를 통해 개발자는 기존 PDF 문서에서 이미지를 추출하여 로컬 디스크에 저장할 수도 있습니다.

PDF에 이미지 추가 - 자바

// Create a new PDF document
PDDocument document = new PDDocument();
// Create a new page
PDPage page = new PDPage();
// Add page
document.addPage(page);
// Initialize PDImageXObject object
PDImageXObject pdImage = PDImageXObject.createFromFile("logo.png",document);
// Initialize PDPageContentStream object
PDPageContentStream contents = new PDPageContentStream(document, page);
// Drawing image
contents.drawImage(pdImage, 70, 250);
// Close contents
contents.close();
// save document
document.save("image.pdf");

Java 라이브러리를 사용하여 다양한 방법으로 PDF 문서 인쇄

Apache PDFBox를 사용하면 Java 개발자가 표준 Java 인쇄 API를 사용하여 PDF 문서를 인쇄할 수 있습니다. 개발자는 PDF 문서를 다양한 방법으로 인쇄할 수 있습니다. 개발자는 이제 권장되는 인쇄 방법인 실제 크기로 문서를 인쇄할 수 있습니다. 인쇄 미리보기 대화 상자와 사용자 정의 속성을 사용한 인쇄를 지원합니다. 개발자는 사용자 정의 페이지 크기와 사용자 정의 여백을 사용하여 PDF 문서를 인쇄할 수도 있습니다.

Java API를 통해 PDF 파일 인쇄

 import java.awt.print.PrinterException;
 import java.io.IOException;
 import org.apache.pdfbox.pdmodel.PDDocument;
 public class Print {
public static void main(String[] args) throws IOException, PrinterException
{
  PDDocument pdf=PDDocument.load("d:\\filename.pdf");
      pdf.print();
}
}
 한국인