1. 제품
  2.   도표
  3.   Java
  4.   Apache POI HDGF

Apache POI HDGF

 
 

Visio 다이어그램용 오픈 소스 Java 라이브러리

무료 Java API를 통해 Microsoft Visio 바이너리 형식으로 저장된 텍스트 콘텐츠를 읽고 추출합니다.

Apache POI HDGF(Horrible DiaGram Format)는 Microsoft Visio 바이너리(VSD) 파일을 위한 순수한 Java 구현입니다. 이 모듈은 젊고 현재로서는 기능이 제한되어 있지만 파일에서 텍스트 콘텐츠를 추출하는 방법을 제공하기 위해 스트림, 청크 및 청크 명령에 대한 저수준 액세스를 제공합니다.  

Previous Next

Apache POI HDGF 시작하기

먼저 시스템에 JDK(Java Development Kit)가 설치되어 있어야 합니다. 이미 가지고 있는 경우 Apache POI의 다운로드 페이지로 이동하여 아카이브에서 최신 안정 릴리스를 얻으십시오. 필요한 라이브러리가 Java 프로그램에 링크될 수 있는 디렉토리에서 ZIP 파일의 컨텐츠를 추출하십시오. 그게 다야!

Maven 기반 Java 프로젝트에서 Apache POI를 참조하는 것은 훨씬 더 간단합니다. pom.xml에 다음 종속성을 추가하고 IDE가 Apache POI Jar 파일을 가져와 참조하도록 하기만 하면 됩니다.

Apache POI Maven 종속성

<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
  <groupId>org.apache.poi</groupId>
  <artifactId>poi-scratchpad</artifactId>
  <version>4.1.0</version>
</dependency>

Java를 통해 Visio Diagram에서 텍스트 콘텐츠 추출

Apache POI HDGF는 모든 프로젝트 지원 파일 형식에 대한 기본 텍스트 추출을 제공했습니다. POI-HDGF를 사용하면 소프트웨어 개발자가 Visio 파일에서 텍스트 콘텐츠를 추출할 수 있습니다. 개발자는 전체 Visio 다이어그램 텍스트를 다루기 위해 Visio 다이어그램 페이지를 반복해야 합니다. VisioTextExtractor 클래스를 사용하여 Visio 파일의 모든 텍스트 항목을 찾고 해당 내용을 반환할 수 있습니다. 파일의 텍스트 내용을 반환합니다. 각 텍스트 개체의 텍스트는 줄 바꿈으로 구분됩니다.

VSD에서 텍스트 추출 - Java

// open VSD file
VisioTextExtractor extractor = new VisioTextExtractor(new FileInputStream("sample.vsd"));
// read text
System.out.println(extractor.getAllText());

Microsoft Visio 다이어그램에 액세스하고 읽기 위한 Java API

Apache POI-HDGF를 사용하면 프로그래머가 VSD 파일 형식의 Visio 문서에 액세스할 수 있습니다. 개발자는 Visio 다이어그램의 내용을 읽을 수 있습니다. API는 초기 단계이므로 현재 사용 가능한 기능이 제한되어 있습니다. 

 한국인