Twórz prosty i przejrzysty HTML z Microsoft® Word Docs za pomocą Mammoth

Semantycznie konwertuj Word na HTML, nie martwiąc się, że zawartość zostanie usunięta.

Co to jest mamut?

Mammoth to łatwy w użyciu, prosty i bezproblemowy pakiet, którego można użyć do konwersji dokumentów Worda wygenerowanych z Dokumentów Google, Microsoft Word i LibreOffice na HTML. Jako konwerter dokumentów typu open source do formatu HTML, Mammoth przydaje się do semantycznej konwersji dowolnego dokumentu bez skupiania się na zastosowanym stylu, kolorze lub czcionce.

Mammoth udostępnia prezentacje internetowe, aby zobaczyć, jak konwertuje dokumenty na HTML, jednak jedną z najlepszych funkcji tego konwertera dokumentów na HTML jest wiele obsługiwanych przez niego platform, w tym WordPress, Java/JVM, .NET i Python przez PyPI. Jeśli masz skomplikowane dokumenty utworzone z wieloma stylami i funkcjami kolorystycznymi, może być możliwe znalezienie niezgodności między wynikiem końcowym a plikiem wejściowym.

Niezależnie od tego, w przypadku prostych dokumentów Worda, które muszą zostać przekonwertowane na HTML, Mammoth wykonuje zadanie.

Previous Next

Pierwsze kroki z Mamutem

Zalecanym sposobem instalacji biblioteki Mammoth jest użycie npm. Użyj następującego polecenia, aby uzyskać płynną instalację

Zainstaluj Mammoth przez npm

 npm install mammoth 

Konwertuj Microsoft® Word na HTML za pomocą bezpłatnego interfejsu API JavaScript

Mommoth to otwarty interfejs API JavaScript do konwersji Worda na HTML za darmo. Zapewnia wiele funkcji formatowania i edytowania dokumentów programu Word po ich przekonwertowaniu na kod HTML, takich jak dodawanie nagłówków, list i obrazów, kursywa i pogrubiona czcionka, dodawanie podziałów wierszy i wiele innych. Wszystkie obrazy w słowie doc są domyślnie generowane w wyniku HTML. Możesz również wyodrębnić surowy tekst z dowolnego dokumentu za pomocą funkcji mammoth.extractRawText, jednak zignoruje ona formatowanie z oryginalnego dokumentu.

Konwertuj istniejący plik .docx na HTML

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
 .then(function(result){
  var html = result.value; // The generated HTML
  var messages = result.messages; // Any messages, such as warnings during conversion
 })
 .done(); 

Mapuj style z Worda do HTML za pomocą JavaScript API

W większości przypadków Mammoth mapuje typowe style Microsoft Word DOCX z oryginalnego dokumentu Worda na końcowy wynik HTML. Elementy takie jak Nagłówek 1 w programie Word są konwertowane na H1 w HTML. Jednak Mammoth udostępnia wiele funkcji do konwersji stylów z dokumentu Word na HTML.

Niestandardowa mapa stylu

var mammoth = require("mammoth");
var options = {
 styleMap: [
  "p[style-name='Section Title'] => h1:fresh",
  "p[style-name='Subsection Title'] => h2:fresh"
 ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 Polski