Apache POI HDGF
Visio 图表的开源 Java 库
通过免费的 Java API 读取和提取以 Microsoft Visio 二进制格式存储的文本内容。
Apache POI HDGF 入门
首先,您需要在系统上安装 Java 开发工具包 (JDK)。如果您已经拥有它,请继续访问 Apache POI 的 下载 页面以获取存档中的最新稳定版本。将 ZIP 文件的内容提取到可以将所需库链接到 Java 程序的任何目录中。就这些!
在基于 Maven 的 Java 项目中引用 Apache POI 更加简单。您只需在 pom.xml 中添加以下依赖项,并让您的 IDE 获取和引用 Apache POI Jar 文件。
Apache POI Maven 依赖
<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>4.1.0</version>
</dependency>
通过 Java 从 Visio 图表中提取文本内容
Apache POI HDGF 为所有项目支持的文件格式提供了基本的文本提取。 POI-HDGF 允许软件开发人员从 Visio 文件中提取文本内容。开发人员需要遍历 Visio 图表页面以覆盖整个 Visio 图表文本。他们可以使用 VisioTextExtractor 类来定位 Visio 文件中的所有文本条目并返回其内容。它返回文件的文本内容。每个文本对象的文本将由换行符分隔。
从 VSD 中提取文本 - Java
// open VSD file
VisioTextExtractor extractor = new VisioTextExtractor(new FileInputStream("sample.vsd"));
// read text
System.out.println(extractor.getAllText());
用于访问和阅读 Microsoft Visio 图表的 Java API
Apache POI-HDGF 使程序员能够访问 VSD 文件格式的 Visio 文档。开发人员可以阅读 Visio 图表的内容。由于 API 处于非常早期的阶段,因此目前可用的功能是有限的。