Hozzon létre egyszerű és tiszta HTML-kódot a Microsoft® Word Docsból a Mammoth segítségével
Szemantikusan konvertálja a Word-t HTML-vé anélkül, hogy aggódnia kellene a tartalom törlése miatt.
Mi az a Mamut?
A Mammoth egy könnyen használható, egyszerű, problémamentes csomag, amellyel a Google Dokumentumokból, Microsoft Wordből és LibreOffice-ból generált Word-dokumentumokat HTML-be lehet konvertálni. Nyílt forráskódú Doc-HTML konverterként a Mammoth jól jöhet bármilyen dokumentum szemantikai konvertálásához anélkül, hogy a stílusra, színre vagy betűtípusra kellene összpontosítania.
A Mammoth webes bemutatókat biztosít, hogy megtudja, hogyan alakítja át a dokumentumokat HTML-be, azonban ennek a HTML-dokumentum-átalakítónak az egyik legjobb tulajdonsága az, hogy számos platformot támogat, beleértve a WordPress-t, a Java/JVM-et, a .NET-et és a PyPI-n keresztüli Pythont. Ha bonyolult dokumentumokat hozott létre sok stílussal és színjellemzővel, előfordulhat, hogy eltérést talál a végeredmény és a bemeneti fájl között.
Ettől függetlenül az egyszerű Word-dokumentumok esetében, amelyeket HTML-be kell konvertálni, a Mammoth elvégzi a munkát.
Kezdő lépések a Mammoth-tal
A Mammoth könyvtár telepítésének javasolt módja az npm. Kérjük, használja a következő parancsot a zökkenőmentes telepítéshez
Telepítse a Mammoth-ot npm-en keresztül
npm install mammoth
Konvertálja a Microsoft® Word-et HTML-re ingyenes JavaScript API-n keresztül
A Mommoth egy nyílt forráskódú JavaScript API, amely ingyenesen konvertálja a Word-t HTML-be. Számos funkciót biztosít a Word-dokumentumok formázásához és szerkesztéséhez, ha azokat HTML-be konvertálták, például címsorok, listák és képek hozzáadását, dőlt és félkövér betűtípust, sortörések hozzáadását és még sok mást. A Word doc összes képe alapértelmezés szerint a HTML-eredményben jön létre. A mammoth.extractRawText függvény használatával bármely dokumentumból nyers szöveget is kivonhat, azonban figyelmen kívül hagyja az eredeti dokumentum formázását.
Meglévő .docx fájl konvertálása HTML formátumba
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
Stílusok leképezése Wordből HTML-be JavaScript API-n keresztül
A Mammoth többnyire leképezi a gyakori Microsoft Word DOCX stílusokat egy eredeti Word dokumentumból a HTML végeredménybe. Az olyan elemek, mint a Word 1. címsora, a HTML-ben H1-be konvertálódnak. A Mammoth azonban számos funkciót biztosít a stílusok Word doc-ból HTML-be konvertálásához.
Egyedi stílusú térkép
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);