Skapa enkel och ren HTML från Microsoft® Word Docs med Mammoth

Konvertera Word till HTML semantiskt utan att oroa dig för att innehållet raderas.

Vad är Mammoth?

Mammoth är ett lättanvänt, enkelt, krångligt paket som kan användas för att konvertera Word-dokument som genererats från Google Docs, Microsoft Word och LibreOffice till HTML. Som en öppen källkodskonverterare från Doc till HTML är Mammoth praktiskt för att semantiskt konvertera vilket dokument som helst utan att fokusera på stilen, färgen eller teckensnitten som används.

Mammoth tillhandahåller webbdemos för att se hur den kommer att konvertera dokument till HTML, men en av de bästa funktionerna i denna Doc-konverterare till HTML är de många plattformarna den stöder inklusive WordPress, Java/JVM, .NET och Python genom PyPI. Om du har komplicerade dokument skapade med många stilar och färgfunktioner kan det vara möjligt att hitta en missmatchning mellan slutresultatet och indatafilen.

Oavsett, för enkla Word-dokument som måste konverteras till HTML, får Mammoth jobbet gjort.

Previous Next

Komma igång med Mammoth

Det rekommenderade sättet att installera Mammoth-biblioteket är via npm. Använd följande kommando för en smidig installation

Installera Mammoth via npm

 npm install mammoth 

Konvertera Microsoft® Word till HTML via gratis JavaScript API

Mommoth är ett JavaScript API med öppen källkod för att konvertera Word till HTML gratis. Det ger många funktioner för att formatera och redigera Word-dokument när de har konverterats till HTML, som att lägga till rubriker, listor och bilder, kursivera och fetstil, lägga till radbrytningar och mycket mer. Alla bilder i word doc genereras som standard i HTML-resultatet. Du kan också extrahera råtext från vilket dokument som helst genom att använda mammoth.extractRawText-funktionen, men den ignorerar formateringen från originaldokumentet.

Konvertera en befintlig .docx-fil till HTML

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
 .then(function(result){
  var html = result.value; // The generated HTML
  var messages = result.messages; // Any messages, such as warnings during conversion
 })
 .done(); 

Karta stilar från Word till HTML via JavaScript API

För det mesta mappar Mammoth vanliga Microsoft Word DOCX-stilar från ett original Word-dokument till HTML-slutresultatet. Element som Rubrik 1 i Word konverteras till H1 i HTML. Mammoth tillhandahåller dock många funktioner för att konvertera stilar från Word doc till HTML.

Anpassad stilkarta

var mammoth = require("mammoth");
var options = {
 styleMap: [
  "p[style-name='Section Title'] => h1:fresh",
  "p[style-name='Subsection Title'] => h2:fresh"
 ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 Svenska