Buat HTML sederhana dan bersih dari Microsoft® Word Docs dengan Mammoth
Konversikan Word ke HTML secara semantik tanpa khawatir konten akan terhapus.
Apa itu Mammoth?
Mammoth adalah paket yang mudah digunakan, sederhana, dan tidak repot yang dapat digunakan untuk mengonversi dokumen Word yang dihasilkan dari Google Docs, Microsoft Word, dan LibreOffice menjadi HTML. Sebagai konverter Doc ke HTML open source, Mammoth berguna untuk mengonversi dokumen apa pun secara semantik tanpa berfokus pada gaya, warna, atau font yang digunakan.
Mammoth menyediakan demo web untuk melihat bagaimana ia akan mengubah dokumen menjadi HTML, namun, salah satu fitur terbaik dari konverter Doc ke HTML ini adalah banyak platform yang didukungnya termasuk WordPress, Java/JVM, .NET, dan Python melalui PyPI. Jika Anda memiliki dokumen rumit yang dibuat dengan banyak gaya dan fitur warna, mungkin ada ketidakcocokan antara hasil akhir dan file input.
Terlepas dari itu, untuk dokumen Word sederhana yang perlu diubah menjadi HTML, Mammoth menyelesaikan pekerjaannya.
Memulai dengan Mammoth
Cara yang disarankan untuk menginstal perpustakaan Mammoth adalah melalui npm. Silakan gunakan perintah berikut untuk instalasi yang lancar
Install Mammoth via npm
Instal Mammoth melalui npm
npm install mammoth
Konversi Microsoft® Word ke HTML melalui API JavaScript Gratis
Mommoth adalah API JavaScript open source untuk mengonversi Word ke HTML secara Gratis. Ini menyediakan banyak fitur untuk memformat dan mengedit dokumen Word ketika mereka telah diubah menjadi HTML seperti menambahkan Judul, Daftar, dan gambar, Miringkan dan font tebal, menambahkan jeda baris, dan banyak lagi. Semua gambar dalam kata doc dihasilkan dalam hasil HTML secara default. Anda juga dapat mengekstrak teks mentah dari dokumen apa pun dengan menggunakan fungsi mammoth.extractRawText, namun, ini akan mengabaikan pemformatan dari dokumen asli.
Convert an existing .docx file to HTML
Konversikan file .docx yang ada ke HTML
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
Gaya Peta dari Word ke HTML melalui JavaScript API
Untuk sebagian besar, Mammoth memetakan gaya DOCX Microsoft Word yang umum dari dokumen Word asli ke dalam hasil akhir HTML. Elemen seperti Heading 1 di Word diubah menjadi H1 dalam HTML. Namun, Mammoth memang menyediakan banyak fungsi untuk mengonversi gaya dari dokumen Word ke HTML.
Custom Style Map
Peta Gaya Kustom
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);