Mammoth를 사용하여 Microsoft® Word 문서에서 간단하고 깔끔한 HTML 만들기
내용이 지워지는 것에 대해 걱정하지 않고 의미적으로 Word를 HTML로 변환합니다.
매머드 란 무엇입니까?
Mammoth는 Google 문서, Microsoft Word 및 LibreOffice에서 생성된 Word 문서를 HTML로 변환하는 데 사용할 수 있는 사용하기 쉽고 간단한 패키지입니다. 오픈 소스 Doc to HTML 변환기인 Mammoth는 사용된 스타일, 색상 또는 글꼴에 초점을 맞추지 않고 문서를 의미론적으로 변환하는 데 편리합니다.
Mammoth는 문서를 HTML로 변환하는 방법을 볼 수 있는 웹 데모를 제공하지만 이 문서를 HTML로 변환하는 가장 좋은 기능 중 하나는 PyPI를 통해 WordPress, Java/JVM, .NET 및 Python을 포함하여 지원하는 많은 플랫폼입니다. 많은 스타일과 색상 기능으로 복잡한 문서를 만든 경우 최종 결과와 입력 파일 간에 불일치를 찾을 수 있습니다.
그럼에도 불구하고 HTML로 변환해야 하는 간단한 Word 문서의 경우 Mammoth가 작업을 완료합니다.
맘모스 시작하기
Mammoth 라이브러리를 설치하는 권장 방법은 npm을 사용하는 것입니다. 원활한 설치를 위해 다음 명령어를 사용해주세요.
Install Mammoth via npm
npm을 통해 Mammoth 설치
npm install mammoth
무료 JavaScript API를 통해 Microsoft® Word를 HTML로 변환
Mommoth는 무료로 Word를 HTML로 변환하는 오픈 소스 JavaScript API입니다. 제목, 목록 및 이미지 추가, 기울임꼴 및 굵게 글꼴 추가, 줄 바꿈 추가 등과 같이 HTML로 변환된 Word 문서의 서식을 지정하고 편집하는 많은 기능을 제공합니다. doc이라는 단어의 모든 이미지는 기본적으로 HTML 결과에 생성됩니다. mammoth.extractRawText 함수를 사용하여 모든 문서에서 원시 텍스트를 추출할 수도 있지만 원본 문서의 서식은 무시됩니다.
Convert an existing .docx file to HTML
기존 .docx 파일을 HTML로 변환
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
JavaScript API를 통해 Word에서 HTML로 스타일 매핑
대부분의 경우 Mammoth는 원본 Word 문서의 일반적인 Microsoft Word DOCX 스타일을 HTML 최종 결과에 매핑합니다. Word의 Heading 1과 같은 요소는 HTML에서 H1으로 변환됩니다. 그러나 Mammoth는 Word 문서에서 HTML로 스타일을 변환하는 많은 기능을 제공합니다.
Custom Style Map
사용자 정의 스타일 맵
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);