افتح المصدر Java API لمستندات Word DOCX

قم بإنشاء وقراءة وتحرير وتحويل ملفات Microsoft Word DOCX وإضافة نص وجداول عبر مكتبة Java.

DOCX4J هي مكتبة مفتوحة المصدر (Apache v2) قائمة على JAXB لمعالجة تنسيقات ملفات Microsoft Office. يوفر وظيفة قراءة وكتابة وتحرير وحفظ تنسيق ملف Microsoft Word 2007 DOCX.

DOCX4J مشابه لـ OpenXML SDK من Microsoft ، ولكن لـ Java. يستخدم JAXB لإنشاء تمثيل كائن في الذاكرة. باستخدام واجهة برمجة التطبيقات ، يمكنك إنشاء مستندات Mircosoft Office وتعديلها وتنسيق النص والفقرات وإدراج الجداول والصور وإدارة عناصر النموذج الأخرى وغير ذلك الكثير. في الأساس ، ينصب تركيزه على الطاقة ، إذا كان التنسيق يدعمها ، فيمكنك القيام بذلك باستخدام واجهة برمجة التطبيقات.

Previous Next

الشروع في العمل مع DOCX4J

بادئ ذي بدء ، تحتاج إلى تثبيت Java Development Kit (JDK) على نظامك. الرجوع إلى DOCX4J في مشروع Java المستند إلى Maven أبسط. كل ما تحتاجه هو إضافة التبعية التالية في ملف pom.xml الخاص بك والسماح لـ IDE بجلب ملفات DOCX4J Jar والرجوع إليها.

تبعية المخضرم DOCX4J

<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-Internal</artifactId>
<version>8.0.0</version>
</dependency>
<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-ReferenceImpl</artifactId>
<version>8.0.0</version>
</dependency>
<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-MOXy</artifactId>
<version>8.0.0</version>
</dependency>
  

أضف فقرة وصورة وجدول إلى مستندات Word

يسمح DOCX4J للمطورين بإضافة فقرات وصور إلى مستندات Word. توفر API أيضًا ميزة إضافة جداول إلى مستندات DOCX مع إتاحة إمكانية إنشاء جداول بسيطة ومتداخلة ببيانات يحددها المستخدم.

قم بإنشاء DOCX مجانًا باستخدام DOCX4J - Java

// Create word package
WordprocessingMLPackage wordPackage = WordprocessingMLPackage.createPackage();
// Create main document part
MainDocumentPart mainDocumentPart = wordPackage.getMainDocumentPart();
// Add Paragraph
mainDocumentPart.addParagraphOfText("Open Source Java API for Word DOCX Documents");
// Save file
wordPackage.save(new File("FileFormat.docx"));

استخراج النص من DOCX

يوفر DOCX4J فئة متخصصة لاستخراج البيانات من مستندات Microsoft Word DOCX ببضعة سطور من التعليمات البرمجية. بالطريقة نفسها ، يمكنه أيضًا استخراج العناوين والحواشي السفلية وبيانات الجدول وما إلى ذلك من ملف Word.

استخراج النص من DOCX Free - Java

// Load document
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(new File("FileFormat.docx"));
// Load main document part
MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();
// Extract nodes
String textNodesXPath = "//w:t";
List<Object> textNodes= mainDocumentPart.getJAXBNodesViaXPath(textNodesXPath, true);
// Print text
for (Object obj : textNodes) {
  Text text = (Text) ((JAXBElement) obj).getValue();
  String textValue = text.getValue();
  System.out.println(textValue);
}                 

إنشاء وتحرير مستندات Word باستخدام Java API

يمكّن DOCX4J مبرمجي البرامج من إنشاء مستندات Word جديدة بتنسيق ملف DOCX. يمكن للمطورين أيضًا تحميل ملف Microsoft Word DOCX موجود لتحريره وفقًا لاحتياجات التطبيق الخاصة بهم. يتيح لك إضافة فقرات جديدة وإدراج نص وتطبيق محاذاة النص والحدود وتغيير نمط النص والمزيد.

تحويل مستندات Microsoft Word Docx إلى PDF

توفر مكتبة Java مفتوحة المصدر docx4j دعمًا كاملاً لإنشاء مستندات Microsoft Word docx وتحويلها إلى تنسيقات شائعة متنوعة. يوفر docx4j 3 طرق مختلفة لتحويل مستندات Microsoft Word docx إلى PDF. يستخدم المثال التالي documents4j (التشغيل عن بعد) لتحويل ملف docx إلى PDF.

تحويل مستندات EWord Docx إلى PDF عبر Java


public class DocxFileToPDF {
public static void main(String[] args) throws IOException, Docx4JException {
File output = new File(System.getProperty("user.dir")+"/result.pdf");
FileOutputStream fos = new FileOutputStream(output); 
Documents4jRemoteServices exporter = new Documents4jRemoteServices();
exporter.export(new File(System.getProperty("user.dir")+"/../docx4j-samples-docx4j/sample-docs/sample-docx.docx") , fos, DocumentType.MS_WORD); 
fos.close();
}
}
 عربي