Lag enkel og ren HTML fra Microsoft® Word Docs med Mammoth

Konverter Word til HTML semantisk uten å bekymre deg for at innholdet blir slettet.

Hva er Mammoth?

Mammoth er en brukervennlig, enkel, problemfri pakke som kan brukes til å konvertere Word-dokumenter generert fra Google Docs, Microsoft Word og LibreOffice til HTML. Som en åpen kildekode Doc til HTML-konverterer, er Mammoth nyttig for semantisk å konvertere ethvert dokument uten å fokusere på stilen, fargen eller skriftene som brukes.

Mammoth tilbyr webdemoer for å se hvordan den vil konvertere dokumenter til HTML, men en av de beste funksjonene til denne Doc-konvertereren til HTML er de mange plattformene den støtter, inkludert WordPress, Java/JVM, .NET og Python gjennom PyPI. Hvis du har kompliserte dokumenter laget med mange stiler og fargefunksjoner, kan det være mulig å finne et misforhold mellom sluttresultatet og inndatafilen.

Uansett, for enkle Word-dokumenter som må konverteres til HTML, får Mammoth jobben gjort.

Previous Next

Komme i gang med Mammoth

Den anbefalte måten å installere Mammoth-biblioteket på er via npm. Bruk følgende kommando for en jevn installasjon

Installer Mammoth via npm

 npm install mammoth 

Konverter Microsoft® Word til HTML via gratis JavaScript API

Mommoth er en åpen kildekode JavaScript API for å konvertere Word til HTML gratis. Det gir mange funksjoner for å formatere og redigere Word-dokumenter når de har blitt konvertert til HTML, for eksempel å legge til overskrifter, lister og bilder, kursiv og fet skrift, legge til linjeskift og mye mer. Alle bilder i word doc genereres som standard i HTML-resultatet. Du kan også trekke ut råtekst fra ethvert dokument ved å bruke mammoth.extractRawText-funksjonen, men den vil ignorere formateringen fra originaldokumentet.

Konverter en eksisterende .docx-fil til HTML

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
  .then(function(result){
    var html = result.value; // The generated HTML
    var messages = result.messages; // Any messages, such as warnings during conversion
  })
  .done(); 

Kartstiler fra Word til HTML via JavaScript API

For det meste kartlegger Mammoth vanlige Microsoft Word DOCX-stiler fra et originalt Word-dokument til HTML-sluttresultatet. Elementer som Overskrift 1 i Word konverteres til H1 i HTML. Mammoth tilbyr imidlertid mange funksjoner for å konvertere stiler fra Word doc til HTML.

Egendefinert stilkart

var mammoth = require("mammoth");
var options = {
  styleMap: [
    "p[style-name='Section Title'] => h1:fresh",
    "p[style-name='Subsection Title'] => h2:fresh"
  ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 Norsk