Open Source Java API για Έγγραφα Word DOCX

Δημιουργήστε, διαβάστε, επεξεργαστείτε και μετατρέψτε αρχεία Microsoft Word DOCX, προσθέστε κείμενο και πίνακες μέσω της βιβλιοθήκης Java.

Η DOCX4J είναι βιβλιοθήκη ανοιχτού κώδικα (Apache v2) που βασίζεται στο JAXB για χειρισμό μορφών αρχείων του Microsoft Office. Παρέχει τη λειτουργία ανάγνωσης, εγγραφής, επεξεργασίας και αποθήκευσης μορφής αρχείου Microsoft Word 2007 DOCX.

Το DOCX4J είναι παρόμοιο με το OpenXML SDK της Microsoft, αλλά για Java. Χρησιμοποιεί το JAXB για να δημιουργήσει την αναπαράσταση αντικειμένου στη μνήμη. Χρησιμοποιώντας το API μπορείτε να δημιουργήσετε έγγραφα του Mircosoft Office, να τα επεξεργαστείτε, να μορφοποιήσετε το κείμενο και τις παραγράφους, να εισαγάγετε πίνακες και εικόνες και να διαχειριστείτε άλλα στοιχεία φόρμας και πολλά άλλα. Βασικά, η έμφαση δίνεται στην ισχύ, εάν η μορφή το υποστηρίζει μπορείτε να το κάνετε χρησιμοποιώντας το API.

Previous Next

Ξεκινώντας με το DOCX4J

Πρώτα απ 'όλα, πρέπει να έχετε εγκατεστημένο το Java Development Kit (JDK) στο σύστημά σας. Η αναφορά στο DOCX4J στο έργο Java που βασίζεται στο Maven είναι ακόμα πιο απλή. Το μόνο που χρειάζεστε είναι να προσθέσετε την ακόλουθη εξάρτηση στο pom.xml και να αφήσετε το IDE σας να ανακτήσει και να παραπέμψει στα αρχεία DOCX4J Jar.

DOCX4J Maven Dependency

<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-Internal</artifactId>
<version>8.0.0</version>
</dependency>
<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-ReferenceImpl</artifactId>
<version>8.0.0</version>
</dependency>
<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-MOXy</artifactId>
<version>8.0.0</version>
</dependency>
  

Προσθήκη παραγράφου, εικόνας και πίνακα στα έγγραφα του Word

Το DOCX4J επιτρέπει στους προγραμματιστές να προσθέτουν παραγράφους και εικόνες σε έγγραφα του Word. Το API παρέχει επίσης τη δυνατότητα προσθήκης πινάκων σε έγγραφα DOCX ενώ καθιστά δυνατή τη δημιουργία απλών και ένθετων πινάκων με δεδομένα που ορίζονται από τον χρήστη.

Δημιουργήστε DOCX Free χρησιμοποιώντας DOCX4J - Java

// Create word package
WordprocessingMLPackage wordPackage = WordprocessingMLPackage.createPackage();
// Create main document part
MainDocumentPart mainDocumentPart = wordPackage.getMainDocumentPart();
// Add Paragraph
mainDocumentPart.addParagraphOfText("Open Source Java API for Word DOCX Documents");
// Save file
wordPackage.save(new File("FileFormat.docx"));

Εξαγωγή κειμένου από το DOCX

Το DOCX4J παρέχει την εξειδικευμένη κλάση για εξαγωγή δεδομένων από έγγραφα Microsoft Word DOCX με λίγες μόνο γραμμές κώδικα. Με τον ίδιο τρόπο, μπορεί επίσης να εξάγει επικεφαλίδες, υποσημειώσεις, δεδομένα πίνακα και ούτω καθεξής από ένα αρχείο Word.

Εξαγωγή κειμένου από το DOCX Free - Java

// Load document
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(new File("FileFormat.docx"));
// Load main document part
MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();
// Extract nodes
String textNodesXPath = "//w:t";
List<Object> textNodes= mainDocumentPart.getJAXBNodesViaXPath(textNodesXPath, true);
// Print text
for (Object obj : textNodes) {
  Text text = (Text) ((JAXBElement) obj).getValue();
  String textValue = text.getValue();
  System.out.println(textValue);
}                 

Δημιουργήστε και επεξεργαστείτε έγγραφα του Word χρησιμοποιώντας το Java API

Το DOCX4J επιτρέπει στους προγραμματιστές λογισμικού να δημιουργούν νέα έγγραφα Word σε μορφή αρχείου DOCX. Οι προγραμματιστές μπορούν επίσης να φορτώσουν ένα υπάρχον αρχείο DOCX του Microsoft Word για να το επεξεργαστούν σύμφωνα με τις ανάγκες της εφαρμογής τους. Σας επιτρέπει να προσθέσετε νέες παραγράφους, να εισαγάγετε κείμενο, να εφαρμόσετε στοίχιση κειμένου και περιγράμματα, να αλλάξετε το στυλ κειμένου και πολλά άλλα.

Μετατροπή εγγράφων Microsoft Word Docx σε PDF

Η βιβλιοθήκη Java ανοιχτού κώδικα docx4j παρέχει πλήρη υποστήριξη για τη δημιουργία και μετατροπή εγγράφων Microsoft Word docx σε διάφορες δημοφιλείς μορφές. Εκεί το docx4j παρέχει 3 διαφορετικούς τρόπους μετατροπής εγγράφων Microsoft Word docx σε PDF. Το παρακάτω παράδειγμα χρησιμοποιεί το document4j (εκτελείται από απόσταση) για τη μετατροπή ενός αρχείου docx σε PDF.

Μετατροπή εγγράφων EWord Docx σε PDF μέσω Java


public class DocxFileToPDF {
public static void main(String[] args) throws IOException, Docx4JException {
File output = new File(System.getProperty("user.dir")+"/result.pdf");
FileOutputStream fos = new FileOutputStream(output); 
Documents4jRemoteServices exporter = new Documents4jRemoteServices();
exporter.export(new File(System.getProperty("user.dir")+"/../docx4j-samples-docx4j/sample-docs/sample-docx.docx") , fos, DocumentType.MS_WORD); 
fos.close();
}
}
 Ελληνικά