Vytvářejte jednoduché a čisté HTML z Microsoft® Word Docs pomocí Mammoth
Sémanticky převádějte Word do HTML bez obav z vymazání obsahu.
Co je Mamut?
Mammoth je snadno použitelný, jednoduchý a bezproblémový balíček, který lze použít k převodu dokumentů aplikace Word generovaných z Dokumentů Google, Microsoft Word a LibreOffice do HTML. Jako open source převaděč dokumentů do HTML se Mammoth hodí k sémantickému převodu jakéhokoli dokumentu, aniž by se zaměřoval na použitý styl, barvu nebo písma.
Mammoth poskytuje webové ukázky, abyste viděli, jak převede dokumenty do HTML, nicméně jednou z nejlepších funkcí tohoto konvertoru dokumentů do HTML je mnoho platforem, které podporuje, včetně WordPress, Java/JVM, .NET a Python prostřednictvím PyPI. Pokud máte složité dokumenty vytvořené s mnoha styly a barevnými prvky, může být možné najít nesoulad mezi konečným výsledkem a vstupním souborem.
Bez ohledu na to, u jednoduchých dokumentů Wordu, které je třeba převést do HTML, Mammoth svou práci udělá.
Začínáme s Mamutem
Doporučený způsob instalace knihovny Mammoth je přes npm. Pro bezproblémovou instalaci použijte prosím následující příkaz
Nainstalujte Mammoth přes npm
npm install mammoth
Převeďte Microsoft® Word do HTML pomocí bezplatného JavaScript API
Mommoth je open source JavaScript API pro převod Wordu do HTML zdarma. Poskytuje mnoho funkcí pro formátování a úpravu dokumentů Wordu, když byly převedeny do HTML, jako je přidávání nadpisů, seznamů a obrázků, kurzíva a tučné písmo, přidávání zalomení řádků a mnoho dalšího. Všechny obrázky ve slově doc jsou ve výchozím nastavení generovány ve výsledku HTML. Z libovolného dokumentu můžete také extrahovat nezpracovaný text pomocí funkce mammoth.extractRawText, bude však ignorovat formátování z původního dokumentu.
Převeďte existující soubor .docx na HTML
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
Mapujte styly z Wordu do HTML přes JavaScript API
Mammoth z větší části mapuje běžné styly DOCX aplikace Microsoft Word z původního dokumentu aplikace Word do konečného výsledku HTML. Prvky, jako je Nadpis 1 ve Wordu, jsou převedeny na H1 v HTML. Mammoth však poskytuje mnoho funkcí pro převod stylů z dokumentu Word do HTML.
Vlastní mapa stylu
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);