Opret enkel og ren HTML fra Microsoft® Word Docs med Mammoth
Konverter Word til HTML semantisk uden at bekymre dig om, at indholdet bliver slettet.
Hvad er Mammoth?
Mammoth er en nem at bruge, enkel, problemfri pakke, der kan bruges til at konvertere Word-dokumenter genereret fra Google Docs, Microsoft Word og LibreOffice til HTML. Som en open source Doc til HTML-konverter er Mammoth praktisk til semantisk at konvertere ethvert dokument uden at fokusere på den anvendte stil, farve eller skrifttyper.
Mammoth leverer webdemoer for at se, hvordan den vil konvertere dokumenter til HTML, men en af de bedste funktioner ved denne Doc-konverter til HTML er de mange platforme, den understøtter, herunder WordPress, Java/JVM, .NET og Python gennem PyPI. Hvis du har komplicerede dokumenter oprettet med mange stilarter og farvefunktioner, kan det være muligt at finde et misforhold mellem slutresultatet og inputfilen.
Uanset hvad, for simple Word-dokumenter, der skal konverteres til HTML, får Mammoth arbejdet gjort.
Kom godt i gang med Mammoth
Den anbefalede måde at installere Mammoth-biblioteket på er via npm. Brug venligst følgende kommando for en problemfri installation
Installer Mammoth via npm
npm install mammoth
Konverter Microsoft® Word til HTML via gratis JavaScript API
Mommoth er en open source JavaScript API til at konvertere Word til HTML gratis. Det giver mange funktioner til at formatere og redigere Word-dokumenter, når de er blevet konverteret til HTML, såsom tilføjelse af overskrifter, lister og billeder, kursiv og fed skrift, tilføjelse af linjeskift og meget mere. Alle billeder i word doc genereres som standard i HTML-resultatet. Du kan også udtrække rå tekst fra ethvert dokument ved at bruge mammoth.extractRawText-funktionen, men det vil ignorere formateringen fra det originale dokument.
Konverter en eksisterende .docx-fil til HTML
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
Kortstile fra Word til HTML via JavaScript API
For det meste kortlægger Mammoth almindelige Microsoft Word DOCX-stile fra et originalt Word-dokument til HTML-slutresultatet. Elementer såsom Overskrift 1 i Word konverteres til H1 i HTML. Mammoth giver dog mange funktioner til at konvertere stilarter fra Word doc til HTML.
Brugerdefineret stilkort
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);