Erstellen Sie mit Mammoth einfachen und sauberen HTML-Code aus Microsoft® Word-Dokumenten

Konvertieren Sie Word semantisch in HTML, ohne sich Gedanken darüber machen zu müssen, dass der Inhalt gelöscht wird.

Was ist Mammut?

Mammoth ist ein benutzerfreundliches, unkompliziertes Paket, mit dem Word-Dokumente, die aus Google Docs, Microsoft Word und LibreOffice generiert wurden, in HTML konvertiert werden können. Als Open-Source-Doc-zu-HTML-Konverter ist Mammoth praktisch, um jedes Dokument semantisch zu konvertieren, ohne sich auf Stil, Farbe oder verwendete Schriftarten zu konzentrieren.

Mammoth bietet Webdemos, um zu sehen, wie es Dokumente in HTML konvertiert. Eine der besten Funktionen dieses Doc-Konverters in HTML sind jedoch die vielen unterstützten Plattformen, einschließlich WordPress, Java/JVM, .NET und Python über PyPI. Wenn Sie komplizierte Dokumente mit vielen Stilen und Farbfunktionen erstellt haben, kann es möglich sein, dass das Endergebnis und die Eingabedatei nicht übereinstimmen.

Unabhängig davon erledigt Mammoth die Arbeit für einfache Word-Dokumente, die in HTML konvertiert werden müssen.

Previous Next

Erste Schritte mit Mammut

Die empfohlene Methode zum Installieren der Mammoth-Bibliothek ist über npm. Bitte verwenden Sie den folgenden Befehl für eine reibungslose Installation

Installieren Sie Mammoth über npm

 npm install mammoth 

Konvertieren Sie Microsoft® Word über die kostenlose JavaScript-API in HTML

Mommoth ist eine Open-Source-JavaScript-API zum kostenlosen Konvertieren von Word in HTML. Es bietet viele Funktionen zum Formatieren und Bearbeiten von Word-Dokumenten, wenn sie in HTML konvertiert wurden, z. B. Hinzufügen von Überschriften, Listen und Bildern, Kursiv- und Fettschrift, Hinzufügen von Zeilenumbrüchen und vieles mehr. Alle Bilder im Word-Dokument werden standardmäßig im HTML-Ergebnis generiert. Sie können auch Rohtext aus jedem Dokument extrahieren, indem Sie die Funktion mammoth.extractRawText verwenden, jedoch wird die Formatierung aus dem Originaldokument ignoriert.

Konvertieren Sie eine vorhandene .docx-Datei in HTML

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
  .then(function(result){
    var html = result.value; // The generated HTML
    var messages = result.messages; // Any messages, such as warnings during conversion
  })
  .done(); 

Ordnen Sie Stile von Word zu HTML über die JavaScript-API zu

Zum größten Teil bildet Mammoth gängige Microsoft Word DOCX-Stile aus einem ursprünglichen Word-Dokument in das HTML-Endergebnis ab. Elemente wie Überschrift 1 in Word werden in H1 in HTML umgewandelt. Mammoth bietet jedoch viele Funktionen zum Konvertieren von Stilen aus Word-Dokumenten in HTML.

Karte im benutzerdefinierten Stil

var mammoth = require("mammoth");
var options = {
  styleMap: [
    "p[style-name='Section Title'] => h1:fresh",
    "p[style-name='Subsection Title'] => h2:fresh"
  ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 Deutsch