Apache POI HDGF
Biblioteca Java de código aberto para diagramas do Visio
Leia e extraia conteúdo textual armazenado no formato binário do Microsoft Visio por meio de APIs Java gratuitas.
Apache POI HDGF (Horrible DiaGram Format) é uma implementação Java pura para arquivos binários (VSD) do Microsoft Visio. Este módulo é jovem e seus recursos são limitados no momento, no entanto, ele fornece acesso de baixo nível aos streams, chunks e comandos de chunk para fornecer uma maneira de extrair o conteúdo textual do arquivo.
Primeiros passos com o Apache POI HDGF
Antes de tudo, você precisa ter o Java Development Kit (JDK) instalado em seu sistema. Se você já o possui, vá para a página download do POI do Apache para obter a versão estável mais recente em um arquivo. Extraia o conteúdo do arquivo ZIP em qualquer diretório de onde as bibliotecas necessárias possam ser vinculadas ao seu programa Java. Isso é tudo!
Fazer referência ao Apache POI em seu projeto Java baseado em Maven é ainda mais simples. Tudo que você precisa é adicionar a seguinte dependência em seu pom.xml e deixar seu IDE buscar e referenciar os arquivos Apache POI Jar.
Dependência do Apache POI Maven
<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>4.1.0</version>
</dependency>
Extraia o conteúdo textual do diagrama do Visio via Java
O Apache POI HDGF fornece extração de texto básica para todos os formatos de arquivo compatíveis com o projeto. POI-HDGF permite que desenvolvedores de software extraiam o conteúdo textual de um arquivo do Visio. Os desenvolvedores precisam percorrer as páginas do diagrama do Visio para cobrir todo o texto do diagrama do Visio. Eles podem usar a classe VisioTextExtractor para localizar todas as entradas de texto em um arquivo do Visio e retornar seu conteúdo. Retorna o conteúdo textual do arquivo. O texto de cada objeto textual será separado por uma nova linha.
Extrair texto do VSD - Java
// open VSD file
VisioTextExtractor extractor = new VisioTextExtractor(new FileInputStream("sample.vsd"));
// read text
System.out.println(extractor.getAllText());
APIs Java para acessar e ler diagramas do Microsoft Visio
O Apache POI-HDGF permite que os programadores acessem documentos do Visio em formatos de arquivo VSD. Os desenvolvedores podem ler o conteúdo de um diagrama do Visio. Como a API está em um estágio muito inicial, os recursos disponíveis são limitados no momento.