Crea HTML semplice e pulito da Microsoft® Word Docs con Mammoth
Converti semanticamente Word in HTML senza preoccuparti che il contenuto venga cancellato.
Cos'è il mammut?
Mammoth è un pacchetto facile da usare, semplice e senza complicazioni che può essere utilizzato per convertire documenti Word generati da Google Docs, Microsoft Word e LibreOffice in HTML. In quanto convertitore open source da Doc a HTML, Mammoth è utile per convertire semanticamente qualsiasi documento senza concentrarsi sullo stile, sul colore o sui caratteri utilizzati.
Mammoth fornisce demo web per vedere come convertirà i documenti in HTML, tuttavia, una delle migliori caratteristiche di questo convertitore di documenti in HTML sono le numerose piattaforme che supporta, tra cui WordPress, Java/JVM, .NET e Python tramite PyPI. Se hai documenti complicati creati con molti stili e caratteristiche di colore, potrebbe essere possibile trovare una mancata corrispondenza tra il risultato finale e il file di input.
Indipendentemente da ciò, per semplici documenti Word che devono essere convertiti in HTML, Mammoth fa il suo lavoro.
Iniziare con Mammut
Il modo consigliato per installare la libreria Mammoth è tramite npm. Si prega di utilizzare il comando seguente per un'installazione senza problemi
Installa Mammoth tramite npm
npm install mammoth
Converti Microsoft® Word in HTML tramite l'API JavaScript gratuita
Mommoth è un'API JavaScript open source per convertire gratuitamente Word in HTML. Fornisce molte funzionalità per formattare e modificare i documenti di Word quando sono stati convertiti in HTML come l'aggiunta di intestazioni, elenchi e immagini, corsivo e grassetto, aggiunta di interruzioni di riga e molto altro. Tutte le immagini nella parola doc vengono generate nel risultato HTML per impostazione predefinita. Puoi anche estrarre testo non elaborato da qualsiasi documento utilizzando la funzione mammoth.extractRawText, tuttavia, ignorerà la formattazione del documento originale.
Converti un file .docx esistente in HTML
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
Mappa gli stili da Word a HTML tramite l'API JavaScript
Per la maggior parte, Mammoth mappa gli stili comuni di Microsoft Word DOCX da un documento Word originale al risultato finale HTML. Elementi come l'intestazione 1 in Word vengono convertiti in H1 in HTML. Tuttavia, Mammoth fornisce molte funzioni per convertire gli stili da Word doc in HTML.
Mappa stile personalizzato
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);