Buat HTML sederhana dan bersih dari Microsoft® Word Docs dengan Mammoth

Konversikan Word ke HTML secara semantik tanpa khawatir konten akan terhapus.

Apa itu Mammoth?

Mammoth adalah paket yang mudah digunakan, sederhana, dan tidak repot yang dapat digunakan untuk mengonversi dokumen Word yang dihasilkan dari Google Docs, Microsoft Word, dan LibreOffice menjadi HTML. Sebagai konverter Doc ke HTML open source, Mammoth berguna untuk mengonversi dokumen apa pun secara semantik tanpa berfokus pada gaya, warna, atau font yang digunakan.

Mammoth menyediakan demo web untuk melihat bagaimana ia akan mengubah dokumen menjadi HTML, namun, salah satu fitur terbaik dari konverter Doc ke HTML ini adalah banyak platform yang didukungnya termasuk WordPress, Java/JVM, .NET, dan Python melalui PyPI. Jika Anda memiliki dokumen rumit yang dibuat dengan banyak gaya dan fitur warna, mungkin ada ketidakcocokan antara hasil akhir dan file input.

Terlepas dari itu, untuk dokumen Word sederhana yang perlu diubah menjadi HTML, Mammoth menyelesaikan pekerjaannya.

Previous Next

Memulai dengan Mammoth

Cara yang disarankan untuk menginstal perpustakaan Mammoth adalah melalui npm. Silakan gunakan perintah berikut untuk instalasi yang lancar

Install Mammoth via npm

Instal Mammoth melalui npm

 npm install mammoth 

Konversi Microsoft® Word ke HTML melalui API JavaScript Gratis

Mommoth adalah API JavaScript open source untuk mengonversi Word ke HTML secara Gratis. Ini menyediakan banyak fitur untuk memformat dan mengedit dokumen Word ketika mereka telah diubah menjadi HTML seperti menambahkan Judul, Daftar, dan gambar, Miringkan dan font tebal, menambahkan jeda baris, dan banyak lagi. Semua gambar dalam kata doc dihasilkan dalam hasil HTML secara default. Anda juga dapat mengekstrak teks mentah dari dokumen apa pun dengan menggunakan fungsi mammoth.extractRawText, namun, ini akan mengabaikan pemformatan dari dokumen asli.

Convert an existing .docx file to HTML

Konversikan file .docx yang ada ke HTML

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
  .then(function(result){
    var html = result.value; // The generated HTML
    var messages = result.messages; // Any messages, such as warnings during conversion
  })
  .done(); 

Gaya Peta dari Word ke HTML melalui JavaScript API

Untuk sebagian besar, Mammoth memetakan gaya DOCX Microsoft Word yang umum dari dokumen Word asli ke dalam hasil akhir HTML. Elemen seperti Heading 1 di Word diubah menjadi H1 dalam HTML. Namun, Mammoth memang menyediakan banyak fungsi untuk mengonversi gaya dari dokumen Word ke HTML.

Custom Style Map

Peta Gaya Kustom

var mammoth = require("mammoth");
var options = {
  styleMap: [
    "p[style-name='Section Title'] => h1:fresh",
    "p[style-name='Subsection Title'] => h2:fresh"
  ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 Indonesia