1. Produkte
  2.   Diagramm
  3.   Java
  4.   Apache POI HDGF

Apache POI HDGF

 
 

Open-Source-Java-Bibliothek für Visio-Diagramme

Lesen und Extrahieren von Textinhalten, die im Microsoft Visio-Binärformat über kostenlose Java-APIs gespeichert sind.

Apache POI HDGF (Horrible DiaGram Format) ist eine reine Java-Implementierung für Microsoft Visio-Binärdateien (VSD). Dieses Modul ist jung und seine Fähigkeiten sind derzeit begrenzt, es bietet jedoch einen Low-Level-Zugriff auf die Streams, Chunks und Chunk-Befehle, um eine Möglichkeit bereitzustellen, den Textinhalt aus der Datei zu extrahieren.  

Previous Next

Erste Schritte mit Apache POI HDGF

Zunächst muss das Java Development Kit (JDK) auf Ihrem System installiert sein. Wenn Sie es bereits haben, gehen Sie zur Downloadseite von Apache POI, um die neueste stabile Version in einem Archiv zu erhalten. Extrahieren Sie den Inhalt der ZIP-Datei in ein beliebiges Verzeichnis, aus dem die benötigten Bibliotheken mit Ihrem Java-Programm verknüpft werden können. Das ist alles!

Das Referenzieren von Apache POI in Ihrem Maven-basierten Java-Projekt ist sogar noch einfacher. Alles, was Sie brauchen, ist, die folgende Abhängigkeit in Ihrer pom.xml hinzuzufügen und Ihre IDE die Apache POI-Jar-Dateien abrufen und referenzieren zu lassen.

Apache POI Maven-Abhängigkeit

<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
  <groupId>org.apache.poi</groupId>
  <artifactId>poi-scratchpad</artifactId>
  <version>4.1.0</version>
</dependency>

Extrahieren Sie Textinhalte aus Visio-Diagrammen über Java

Apache POI HDGF hat eine grundlegende Textextraktion für alle vom Projekt unterstützten Dateiformate bereitgestellt. POI-HDGF ermöglicht Softwareentwicklern, den Textinhalt aus einer Visio-Datei zu extrahieren. Entwickler müssen die Visio-Diagrammseiten durchlaufen, um den gesamten Visio-Diagrammtext abzudecken. Sie können die VisioTextExtractor-Klasse verwenden, um alle Texteinträge in einer Visio-Datei zu finden und ihren Inhalt zurückzugeben. Es gibt den Textinhalt der Datei zurück. Der Text jedes Textobjekts wird durch einen Zeilenumbruch getrennt.

Extrahieren Sie Text aus VSD - Java

// open VSD file
VisioTextExtractor extractor = new VisioTextExtractor(new FileInputStream("sample.vsd"));
// read text
System.out.println(extractor.getAllText());

Java-APIs zum Zugreifen und Lesen von Microsoft Visio-Diagrammen

Apache POI-HDGF ermöglicht Programmierern den Zugriff auf Visio-Dokumente in VSD-Dateiformaten. Entwickler können den Inhalt eines Visio-Diagramms lesen. Da sich die API noch in einem sehr frühen Stadium befindet, sind die verfügbaren Funktionen derzeit begrenzt. 

 Deutsch