Maak eenvoudige en overzichtelijke HTML van Microsoft® Word Docs met Mammoth

Zet Word semantisch om in HTML zonder dat u zich zorgen hoeft te maken over het wissen van de inhoud.

Wat is mammoet?

Mammoth is een gebruiksvriendelijk, eenvoudig pakket zonder gedoe dat kan worden gebruikt om Word-documenten die zijn gegenereerd vanuit Google Docs, Microsoft Word en LibreOffice naar HTML te converteren. Als open source Doc naar HTML-converter is Mammoth handig om elk document semantisch te converteren zonder te focussen op de gebruikte stijl, kleur of lettertypen.

Mammoth biedt webdemo's om te zien hoe het documenten naar HTML zal converteren, maar een van de beste eigenschappen van deze Doc-converter naar HTML is de vele platforms die het ondersteunt, waaronder WordPress, Java/JVM, .NET en Python via PyPI. Als u ingewikkelde documenten hebt gemaakt met veel stijlen en kleurkenmerken, is het mogelijk dat er een mismatch is tussen het eindresultaat en het invoerbestand.

Hoe dan ook, voor eenvoudige Word-documenten die naar HTML moeten worden geconverteerd, krijgt Mammoth de klus geklaard.

Previous Next

Aan de slag met Mammoth

De aanbevolen manier om Mammoth-bibliotheek te installeren is via npm. Gebruik de volgende opdracht voor een vlotte installatie:

Installeer Mammoth via npm

 npm install mammoth 

Converteer Microsoft® Word naar HTML via gratis JavaScript API

Mommoth is een open source JavaScript API om Word gratis naar HTML te converteren. Het biedt veel functies om Word-documenten op te maken en te bewerken wanneer ze zijn geconverteerd naar HTML, zoals het toevoegen van koppen, lijsten en afbeeldingen, cursief en vet lettertype, het toevoegen van regeleinden en nog veel meer. Alle afbeeldingen in het woorddocument worden standaard in het HTML-resultaat gegenereerd. U kunt ook onbewerkte tekst uit elk document extraheren met behulp van de mammoth.extractRawText-functie, maar de opmaak van het originele document wordt genegeerd.

Converteer een bestaand .docx-bestand naar HTML

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
  .then(function(result){
    var html = result.value; // The generated HTML
    var messages = result.messages; // Any messages, such as warnings during conversion
  })
  .done(); 

Kaartstijlen van Word naar HTML via JavaScript API

Voor het grootste deel brengt Mammoth algemene Microsoft Word DOCX-stijlen van een origineel Word-document in kaart in het HTML-eindresultaat. Elementen zoals Kop 1 in Word worden in HTML omgezet naar H1. Mammoth biedt echter veel functies om stijlen van Word-document naar HTML te converteren.

Aangepaste stijlkaart

var mammoth = require("mammoth");
var options = {
  styleMap: [
    "p[style-name='Section Title'] => h1:fresh",
    "p[style-name='Subsection Title'] => h2:fresh"
  ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 Dutch