قم بإنشاء HTML بسيط ونظيف من Microsoft ® Word Docs مع Mammoth

قم بتحويل Word بشكل دلالي إلى HTML دون القلق بشأن حذف المحتوى.

ما هو الماموث؟

Mammoth عبارة عن حزمة سهلة الاستخدام وبسيطة وغير معقدة يمكن استخدامها لتحويل مستندات Word التي تم إنشاؤها من محرّر مستندات Google و Microsoft Word و LibreOffice إلى HTML. بصفته محول Doc إلى HTML مفتوح المصدر ، فإن Mammoth يكون مفيدًا لتحويل أي مستند بشكل دلالي دون التركيز على التصميم أو اللون أو الخطوط المستخدمة.

يوفر Mammoth عروض توضيحية على الويب لمعرفة كيفية تحويل المستندات إلى HTML ، ومع ذلك ، فإن إحدى أفضل ميزات محول Doc هذا إلى HTML هي العديد من الأنظمة الأساسية التي يدعمها بما في ذلك WordPress و Java / JVM و .NET و Python من خلال PyPI. إذا كان لديك مستندات معقدة تم إنشاؤها باستخدام العديد من الأنماط وميزات الألوان ، فقد يكون من الممكن العثور على عدم تطابق بين النتيجة النهائية وملف الإدخال.

بغض النظر ، بالنسبة لمستندات Word البسيطة التي تحتاج إلى تحويل إلى HTML ، فإن Mammoth ينجز المهمة.

Previous Next

الابتداء مع الماموث

الطريقة الموصى بها لتثبيت مكتبة Mammoth هي عبر npm. الرجاء استخدام الأمر التالي للتثبيت السلس

تثبيت Mammoth عبر npm

 npm install mammoth 

تحويل Microsoft ® Word إلى HTML عبر Free JavaScript API

Mommoth هي واجهة برمجة تطبيقات JavaScript API مفتوحة المصدر لتحويل Word إلى HTML مجانًا. يوفر العديد من الميزات لتنسيق مستندات Word وتحريرها عندما يتم تحويلها إلى HTML مثل إضافة العناوين والقوائم والصور والخط المائل والعريض وإضافة فواصل الأسطر وغير ذلك الكثير. يتم إنشاء جميع الصور في كلمة doc في نتيجة HTML افتراضيًا. يمكنك أيضًا استخراج نص خام من أي مستند باستخدام وظيفة mammoth.extractRawText ، ومع ذلك ، ستتجاهل التنسيق من المستند الأصلي.

تحويل ملف docx. موجود إلى HTML

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
  .then(function(result){
    var html = result.value; // The generated HTML
    var messages = result.messages; // Any messages, such as warnings during conversion
  })
  .done(); 

أنماط الخريطة من Word إلى HTML عبر JavaScript API

بالنسبة للجزء الأكبر ، يقوم Mammoth بتعيين أنماط Microsoft Word DOCX الشائعة من مستند Word الأصلي في النتيجة النهائية لـ HTML. يتم تحويل العناصر مثل العنوان 1 في Word إلى H1 بتنسيق HTML. ومع ذلك ، يوفر Mammoth العديد من الوظائف لتحويل الأنماط من Word doc إلى HTML.

مخطط نمط مخصص

var mammoth = require("mammoth");
var options = {
  styleMap: [
    "p[style-name='Section Title'] => h1:fresh",
    "p[style-name='Subsection Title'] => h2:fresh"
  ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 عربي