1. 製品
  2.   ダイアグラム
  3.   Java
  4.   Apache POI HDGF

Apache POI HDGF

 
 

Visio ダイアグラム用のオープン ソース Java ライブラリ

無料の Java API を使用して、Microsoft Visio Binary 形式で保存されたテキスト コンテンツを読み取り、抽出します。

Apache POI HDGF (Horrible DiaGram Format) は、Microsoft Visio バイナリ (VSD) ファイルの純粋な Java 実装です。このモジュールはまだ新しく、その機能は現時点では制限されていますが、ファイルからテキスト コンテンツを抽出する方法を提供するために、ストリーム、チャンク、およびチャンク コマンドへの低レベル アクセスを提供します。  

Previous Next

Apache POI HDGF の使用を開始する

まず、システムに Java Development Kit (JDK) をインストールする必要があります。既にお持ちの場合は、Apache POI の ダウンロード ページに進み、最新の安定版リリースをアーカイブから入手してください。必要なライブラリーを Java プログラムにリンクできる任意のディレクトリーに ZIP ファイルの内容を抽出します。それだけです!

Maven ベースの Java プロジェクトで Apache POI を参照するのはさらに簡単です。必要なのは、pom.xml に次の依存関係を追加し、IDE が Apache POI Jar ファイルを取得して参照できるようにすることだけです。

Apache POI Maven の依存関係

<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
  <groupId>org.apache.poi</groupId>
  <artifactId>poi-scratchpad</artifactId>
  <version>4.1.0</version>
</dependency>

Java を介して Visio ダイアグラムからテキスト コンテンツを抽出する

Apache POI HDGF は、プロジェクトがサポートするすべてのファイル形式に対して基本的なテキスト抽出を提供しています。 POI-HDGF を使用すると、ソフトウェア開発者は Visio ファイルからテキスト コンテンツを抽出できます。開発者は、Visio ダイアグラムのテキスト全体をカバーするために、Visio ダイアグラム ページを繰り返し処理する必要があります。 VisioTextExtractor クラスを使用して、Visio ファイル内のすべてのテキスト エントリを検索し、その内容を返すことができます。ファイルのテキスト コンテンツを返します。各テキスト オブジェクトのテキストは改行で区切られます。

VSD からテキストを抽出 - Java

// open VSD file
VisioTextExtractor extractor = new VisioTextExtractor(new FileInputStream("sample.vsd"));
// read text
System.out.println(extractor.getAllText());

Microsoft Visio ダイアグラムにアクセスして読み取るための Java API

Apache POI-HDGF を使用すると、プログラマは VSD ファイル形式の Visio ドキュメントにアクセスできます。開発者は、Visio ダイアグラムの内容を読み取ることができます。 API は非常に初期段階にあるため、現時点では使用できる機能が限られています。 

 日本