Cree HTML simple y limpio desde Microsoft® Word Docs con Mammoth

Convierte semánticamente Word a HTML sin preocuparte de que se borre el contenido.

¿Qué es mamut?

Mammoth es un paquete fácil de usar, simple y sin complicaciones que se puede usar para convertir documentos de Word generados desde Google Docs, Microsoft Word y LibreOffice a HTML. Como convertidor de código abierto de Doc a HTML, Mammoth resulta útil para convertir semánticamente cualquier documento sin centrarse en el estilo, el color o las fuentes utilizadas.

Mammoth proporciona demostraciones web para ver cómo convierte documentos a HTML; sin embargo, una de las mejores características de este convertidor de documentos a HTML es la gran cantidad de plataformas que admite, incluidas WordPress, Java/JVM, .NET y Python a través de PyPI. Si tiene documentos complicados creados con muchos estilos y características de color, es posible que encuentre una discrepancia entre el resultado final y el archivo de entrada.

Independientemente, para documentos de Word simples que deben convertirse a HTML, Mammoth hace el trabajo.

Previous Next

Primeros pasos con Mammoth

La forma recomendada de instalar la biblioteca Mammoth es a través de npm. Utilice el siguiente comando para una instalación sin problemas

Instalar Mammoth a través de npm

 npm install mammoth 

Convierta Microsoft® Word a HTML a través de la API de JavaScript gratuita

Mommoth es una API de JavaScript de código abierto para convertir Word a HTML de forma gratuita. Proporciona muchas funciones para formatear y editar documentos de Word cuando se han convertido a HTML, como agregar encabezados, listas e imágenes, cursiva y negrita, agregar saltos de línea y mucho más. Todas las imágenes en el documento de Word se generan en el resultado HTML de forma predeterminada. También puede extraer texto sin formato de cualquier documento utilizando la función mammoth.extractRawText; sin embargo, ignorará el formato del documento original.

Convierta un archivo .docx existente a HTML

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
  .then(function(result){
    var html = result.value; // The generated HTML
    var messages = result.messages; // Any messages, such as warnings during conversion
  })
  .done(); 

Mapear estilos de Word a HTML a través de la API de JavaScript

En su mayor parte, Mammoth asigna estilos DOCX comunes de Microsoft Word desde un documento de Word original al resultado final HTML. Elementos como el Título 1 en Word se convierten en H1 en HTML. Sin embargo, Mammoth proporciona muchas funciones para convertir estilos de documentos de Word a HTML.

Mapa de estilo personalizado

var mammoth = require("mammoth");
var options = {
  styleMap: [
    "p[style-name='Section Title'] => h1:fresh",
    "p[style-name='Subsection Title'] => h2:fresh"
  ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 Español