HTML ساده و تمیز را از Microsoft® Word Docs با Mammoth ایجاد کنید

بدون نگرانی در مورد پاک شدن محتوا، Word را به صورت معنایی به HTML تبدیل کنید.

ماموت چیست؟

Mammoth یک بسته با کاربری آسان، ساده و بدون سر و صدا است که می تواند برای تبدیل اسناد Word تولید شده از Google Docs، Microsoft Word و LibreOffice به HTML استفاده شود. به عنوان یک مبدل Doc به HTML منبع باز، Mammoth برای تبدیل معنایی هر سند بدون تمرکز بر استایل، رنگ یا فونت های مورد استفاده مفید است.

Mammoth نمایش های وب را ارائه می دهد تا ببیند چگونه اسناد را به HTML تبدیل می کند، با این حال، یکی از بهترین ویژگی های این مبدل Doc به HTML پلتفرم های بسیاری است که از جمله WordPress، Java/JVM، .NET و Python از طریق PyPI پشتیبانی می کند. اگر اسناد پیچیده‌ای دارید که با سبک‌ها و ویژگی‌های رنگی زیادی ایجاد شده‌اند، ممکن است بین نتیجه نهایی و فایل ورودی ناهماهنگی پیدا کنید.

صرف نظر از این، برای اسناد Word ساده که باید به HTML تبدیل شوند، Mammoth کار را انجام می دهد.

Previous Next

شروع کار با ماموت

روش توصیه شده برای نصب کتابخانه Mammoth از طریق npm است. لطفا از دستور زیر برای نصب راحت استفاده کنید

Mammoth را از طریق npm نصب کنید

 npm install mammoth 

Microsoft® Word را از طریق JavaScript API رایگان به HTML تبدیل کنید

Mommoth یک API جاوا اسکریپت منبع باز برای تبدیل Word به HTML به صورت رایگان است. این ویژگی‌های بسیاری را برای قالب‌بندی و ویرایش اسناد Word در صورت تبدیل آنها به HTML فراهم می‌کند، مانند افزودن سرفصل‌ها، فهرست‌ها و تصاویر، فونت‌های کج و پررنگ، اضافه کردن خطوط شکسته و موارد دیگر. تمام تصاویر در کلمه doc به طور پیش فرض در نتیجه HTML ایجاد می شوند. همچنین می‌توانید با استفاده از تابع mammoth.extractRawText متن خام را از هر سندی استخراج کنید، با این حال، قالب‌بندی سند اصلی را نادیده می‌گیرد.

یک فایل .docx موجود را به HTML تبدیل کنید

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
  .then(function(result){
    var html = result.value; // The generated HTML
    var messages = result.messages; // Any messages, such as warnings during conversion
  })
  .done(); 

سبک های نقشه از Word به HTML از طریق JavaScript API

در بیشتر موارد، Mammoth سبک‌های رایج Microsoft Word DOCX را از یک سند اصلی Word در نتیجه نهایی HTML ترسیم می‌کند. عناصری مانند Heading 1 در Word به H1 در HTML تبدیل می شوند. با این حال، Mammoth توابع زیادی را برای تبدیل سبک‌ها از Word doc به HTML ارائه می‌کند.

نقشه سبک سفارشی

var mammoth = require("mammoth");
var options = {
  styleMap: [
    "p[style-name='Section Title'] => h1:fresh",
    "p[style-name='Subsection Title'] => h2:fresh"
  ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 فارسی