קוד פתוח Java API עבור Word DOCX מסמכים

צור, קרא, ערוך והמר קובצי Microsoft Word DOCX, הוסף טקסט וטבלאות באמצעות ספריית Java.

DOCX4J היא ספריית קוד פתוח מבוססת JAXB (Apache v2) לעיבוד פורמטים של קבצים של Microsoft Office. הוא מספק את הפונקציונליות לקריאה, כתיבה, עריכה ושמירה של פורמט קובץ Microsoft Word 2007 DOCX.

DOCX4J דומה ל-OpenXML SDK של מיקרוסופט, אבל עבור Java. הוא משתמש ב-JAXB כדי ליצור את ייצוג האובייקט בזיכרון. באמצעות ה-API תוכלו ליצור מסמכי Mircosoft Office, לערוך אותם, לעצב את הטקסט והפסקאות, להוסיף טבלאות ותמונות ולנהל רכיבי טופס אחרים ועוד הרבה יותר. בעיקרון, הדגש שלו הוא על כוח, אם הפורמט תומך בזה אתה יכול לעשות את זה באמצעות ה-API.

Previous Next

תחילת העבודה עם DOCX4J

קודם כל, עליך להתקין את ערכת הפיתוח של Java (JDK) במערכת שלך. הפניה ל-DOCX4J בפרויקט Java המבוסס על Maven היא אפילו פשוטה יותר. כל מה שאתה צריך הוא להוסיף את התלות הבאה ב-pom.xml שלך ולתת ל-IDE שלך לאחזר ולהפנות את קבצי DOCX4J Jar.

DOCX4J Maven תלות

<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-Internal</artifactId>
<version>8.0.0</version>
</dependency>
<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-ReferenceImpl</artifactId>
<version>8.0.0</version>
</dependency>
<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-MOXy</artifactId>
<version>8.0.0</version>
</dependency>
  

הוסף פסקה, תמונה וטבלה למסמכי Word

DOCX4J מאפשר למפתחים להוסיף פסקאות ותמונות למסמכי Word. ה-API מספק גם את התכונה להוסיף טבלאות למסמכי DOCX, תוך שהוא מאפשר ליצור טבלאות פשוטות ומקוננות עם נתונים המוגדרים על ידי המשתמש.

צור DOCX חינם באמצעות DOCX4J - Java

// Create word package
WordprocessingMLPackage wordPackage = WordprocessingMLPackage.createPackage();
// Create main document part
MainDocumentPart mainDocumentPart = wordPackage.getMainDocumentPart();
// Add Paragraph
mainDocumentPart.addParagraphOfText("Open Source Java API for Word DOCX Documents");
// Save file
wordPackage.save(new File("FileFormat.docx"));

חלץ טקסט מ-DOCX

DOCX4J מספק את המחלקה המתמחה לחילוץ נתונים ממסמכי Microsoft Word DOCX עם מספר שורות קוד בלבד. באותו אופן, הוא יכול גם לחלץ כותרות, הערות שוליים, נתוני טבלה וכן הלאה מקובץ וורד.

חלץ טקסט מ-DOCX חינם - Java

// Load document
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(new File("FileFormat.docx"));
// Load main document part
MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();
// Extract nodes
String textNodesXPath = "//w:t";
List<Object> textNodes= mainDocumentPart.getJAXBNodesViaXPath(textNodesXPath, true);
// Print text
for (Object obj : textNodes) {
  Text text = (Text) ((JAXBElement) obj).getValue();
  String textValue = text.getValue();
  System.out.println(textValue);
}                 

צור וערוך מסמכי Word באמצעות Java API

DOCX4J מאפשר למתכנתי תוכנה ליצור מסמכי Word חדשים בפורמט קובץ DOCX. מפתחים יכולים גם לטעון קובץ Microsoft Word DOCX קיים כדי לערוך אותו בהתאם לצרכי היישום שלהם. זה מאפשר לך להוסיף פסקאות חדשות, להוסיף טקסט, להחיל יישור טקסט וגבולות, לשנות סגנון טקסט ועוד.

המר מסמכי Microsoft Word Docx ל-PDF

ספריית הקוד הפתוח Java docx4j מספקת תמיכה מלאה ליצירת מסמכי Microsoft Word docx והמרה לפורמטים פופולריים שונים. שם docx4j מספק 3 דרכים שונות להמיר מסמכי Microsoft Word docx ל-PDF. הדוגמה הבאה משתמשת ב-documents4j (פועל מרחוק) כדי להמיר קובץ docx ל-PDF.

המרת מסמכי EWord Docx ל-PDF באמצעות Java


public class DocxFileToPDF {
public static void main(String[] args) throws IOException, Docx4JException {
File output = new File(System.getProperty("user.dir")+"/result.pdf");
FileOutputStream fos = new FileOutputStream(output); 
Documents4jRemoteServices exporter = new Documents4jRemoteServices();
exporter.export(new File(System.getProperty("user.dir")+"/../docx4j-samples-docx4j/sample-docs/sample-docx.docx") , fos, DocumentType.MS_WORD); 
fos.close();
}
}
 עִברִית