Vytvářejte jednoduché a čisté HTML z Microsoft® Word Docs pomocí Mammoth

Sémanticky převádějte Word do HTML bez obav z vymazání obsahu.

Co je Mamut?

Mammoth je snadno použitelný, jednoduchý a bezproblémový balíček, který lze použít k převodu dokumentů aplikace Word generovaných z Dokumentů Google, Microsoft Word a LibreOffice do HTML. Jako open source převaděč dokumentů do HTML se Mammoth hodí k sémantickému převodu jakéhokoli dokumentu, aniž by se zaměřoval na použitý styl, barvu nebo písma.

Mammoth poskytuje webové ukázky, abyste viděli, jak převede dokumenty do HTML, nicméně jednou z nejlepších funkcí tohoto konvertoru dokumentů do HTML je mnoho platforem, které podporuje, včetně WordPress, Java/JVM, .NET a Python prostřednictvím PyPI. Pokud máte složité dokumenty vytvořené s mnoha styly a barevnými prvky, může být možné najít nesoulad mezi konečným výsledkem a vstupním souborem.

Bez ohledu na to, u jednoduchých dokumentů Wordu, které je třeba převést do HTML, Mammoth svou práci udělá.

Previous Next

Začínáme s Mamutem

Doporučený způsob instalace knihovny Mammoth je přes npm. Pro bezproblémovou instalaci použijte prosím následující příkaz

Nainstalujte Mammoth přes npm

 npm install mammoth 

Převeďte Microsoft® Word do HTML pomocí bezplatného JavaScript API

Mommoth je open source JavaScript API pro převod Wordu do HTML zdarma. Poskytuje mnoho funkcí pro formátování a úpravu dokumentů Wordu, když byly převedeny do HTML, jako je přidávání nadpisů, seznamů a obrázků, kurzíva a tučné písmo, přidávání zalomení řádků a mnoho dalšího. Všechny obrázky ve slově doc jsou ve výchozím nastavení generovány ve výsledku HTML. Z libovolného dokumentu můžete také extrahovat nezpracovaný text pomocí funkce mammoth.extractRawText, bude však ignorovat formátování z původního dokumentu.

Převeďte existující soubor .docx na HTML

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
 .then(function(result){
  var html = result.value; // The generated HTML
  var messages = result.messages; // Any messages, such as warnings during conversion
 })
 .done(); 

Mapujte styly z Wordu do HTML přes JavaScript API

Mammoth z větší části mapuje běžné styly DOCX aplikace Microsoft Word z původního dokumentu aplikace Word do konečného výsledku HTML. Prvky, jako je Nadpis 1 ve Wordu, jsou převedeny na H1 v HTML. Mammoth však poskytuje mnoho funkcí pro převod stylů z dokumentu Word do HTML.

Vlastní mapa stylu

var mammoth = require("mammoth");
var options = {
 styleMap: [
  "p[style-name='Section Title'] => h1:fresh",
  "p[style-name='Subsection Title'] => h2:fresh"
 ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 Čeština