צור HTML פשוט ונקי מ-Microsoft® Word Docs עם Mammoth

המרה סמנטית של Word ל-HTML מבלי לדאוג שהתוכן יימחק.

מה זה ממותה?

Mammoth היא חבילה קלה לשימוש, פשוטה וללא טרחה, שניתן להשתמש בה כדי להמיר מסמכי Word שנוצרו מ-Google Docs, Microsoft Word ו-LibreOffice ל-HTML. בתור ממיר Doc ל-HTML בקוד פתוח, Mammoth שימושית להמרה סמנטית של כל מסמך מבלי להתמקד בסגנון, בצבע או בגופנים שבהם נעשה שימוש.

Mammoth מספקת הדגמות אינטרנט כדי לראות כיצד היא תמיר מסמכים ל-HTML, עם זאת, אחת התכונות הטובות ביותר של ממיר Doc ל-HTML היא הפלטפורמות הרבות שבהן הוא תומך, כולל WordPress, Java/JVM, .NET ו-Python דרך PyPI. אם יש לך מסמכים מסובכים שנוצרו עם הרבה סגנונות ותכונות צבע, ייתכן שיהיה אפשר למצוא אי התאמה בין התוצאה הסופית לקובץ הקלט.

בלי קשר, עבור מסמכי Word פשוטים שצריך להמיר ל-HTML, Mammoth עושה את העבודה.

Previous Next

תחילת העבודה עם Mammoth

הדרך המומלצת להתקין את ספריית Mammoth היא באמצעות npm. אנא השתמש בפקודה הבאה להתקנה חלקה

התקן את Mammoth דרך npm

 npm install mammoth 

המר את Microsoft® Word ל-HTML באמצעות API של JavaScript בחינם

Mommoth הוא ממשק API של JavaScript בקוד פתוח להמרת Word ל-HTML בחינם. הוא מספק תכונות רבות לעיצוב ועריכה של מסמכי Word כאשר הם הומרו ל-HTML כגון הוספת כותרות, רשימות ותמונות, נטוי וגופן מודגש, הוספת מעברי שורות ועוד הרבה יותר. כל התמונות ב-word doc נוצרות בתוצאת HTML כברירת מחדל. ניתן גם לחלץ טקסט גולמי מכל מסמך באמצעות הפונקציה mammoth.extractRawText, עם זאת, היא תתעלם מהעיצוב מהמסמך המקורי.

המר קובץ docx קיים ל-HTML

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
  .then(function(result){
    var html = result.value; // The generated HTML
    var messages = result.messages; // Any messages, such as warnings during conversion
  })
  .done(); 

מפה סגנונות מ-Word ל-HTML באמצעות JavaScript API

לרוב, Mammoth אכן ממפה סגנונות נפוצים של Microsoft Word DOCX ממסמך Word מקורי אל תוצאת ה-HTML הסופית. אלמנטים כמו כותרת 1 ב-Word מומרים ל-H1 ב-HTML. עם זאת, Mammoth מספקת פונקציות רבות להמרת סגנונות מ-Word doc ל-HTML.

מפת סגנון מותאם אישית

var mammoth = require("mammoth");
var options = {
  styleMap: [
    "p[style-name='Section Title'] => h1:fresh",
    "p[style-name='Subsection Title'] => h2:fresh"
  ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 עִברִית