1. 产品
  2.   图表
  3.   Java
  4.   Apache POI HDGF

Apache POI HDGF

 
 

Visio 图表的开源 Java 库

通过免费的 Java API 读取和提取以 Microsoft Visio 二进制格式存储的文本内容。

Apache POI HDGF(可怕的图表格式)是 Microsoft Visio 二进制 (VSD) 文件的纯 Java 实现。这个模块很年轻,目前它的功能有限,但是它提供了对流、块和块命令的低级访问,以便提供一种从文件中提取文本内容的方法。  

Previous Next

Apache POI HDGF 入门

首先,您需要在系统上安装 Java 开发工具包 (JDK)。如果您已经拥有它,请继续访问 Apache POI 的 下载 页面以获取存档中的最新稳定版本。将 ZIP 文件的内容提取到可以将所需库链接到 Java 程序的任何目录中。就这些!

在基于 Maven 的 Java 项目中引用 Apache POI 更加简单。您只需在 pom.xml 中添加以下依赖项,并让您的 IDE 获取和引用 Apache POI Jar 文件。

Apache POI Maven 依赖

<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
  <groupId>org.apache.poi</groupId>
  <artifactId>poi-scratchpad</artifactId>
  <version>4.1.0</version>
</dependency>

通过 Java 从 Visio 图表中提取文本内容

Apache POI HDGF 为所有项目支持的文件格式提供了基本的文本提取。 POI-HDGF 允许软件开发人员从 Visio 文件中提取文本内容。开发人员需要遍历 Visio 图表页面以覆盖整个 Visio 图表文本。他们可以使用 VisioTextExtractor 类来定位 Visio 文件中的所有文本条目并返回其内容。它返回文件的文本内容。每个文本对象的文本将由换行符分隔。

从 VSD 中提取文本 - Java

// open VSD file
VisioTextExtractor extractor = new VisioTextExtractor(new FileInputStream("sample.vsd"));
// read text
System.out.println(extractor.getAllText());

用于访问和阅读 Microsoft Visio 图表的 Java API

Apache POI-HDGF 使程序员能够访问 VSD 文件格式的 Visio 文档。开发人员可以阅读 Visio 图表的内容。由于 API 处于非常早期的阶段,因此目前可用的功能是有限的。 

 中国人