HTML ساده و تمیز را از Microsoft® Word Docs با Mammoth ایجاد کنید
بدون نگرانی در مورد پاک شدن محتوا، Word را به صورت معنایی به HTML تبدیل کنید.
ماموت چیست؟
Mammoth یک بسته با کاربری آسان، ساده و بدون سر و صدا است که می تواند برای تبدیل اسناد Word تولید شده از Google Docs، Microsoft Word و LibreOffice به HTML استفاده شود. به عنوان یک مبدل Doc به HTML منبع باز، Mammoth برای تبدیل معنایی هر سند بدون تمرکز بر استایل، رنگ یا فونت های مورد استفاده مفید است.
Mammoth نمایش های وب را ارائه می دهد تا ببیند چگونه اسناد را به HTML تبدیل می کند، با این حال، یکی از بهترین ویژگی های این مبدل Doc به HTML پلتفرم های بسیاری است که از جمله WordPress، Java/JVM، .NET و Python از طریق PyPI پشتیبانی می کند. اگر اسناد پیچیدهای دارید که با سبکها و ویژگیهای رنگی زیادی ایجاد شدهاند، ممکن است بین نتیجه نهایی و فایل ورودی ناهماهنگی پیدا کنید.
صرف نظر از این، برای اسناد Word ساده که باید به HTML تبدیل شوند، Mammoth کار را انجام می دهد.
شروع کار با ماموت
روش توصیه شده برای نصب کتابخانه Mammoth از طریق npm است. لطفا از دستور زیر برای نصب راحت استفاده کنید
Mammoth را از طریق npm نصب کنید
npm install mammoth
Microsoft® Word را از طریق JavaScript API رایگان به HTML تبدیل کنید
Mommoth یک API جاوا اسکریپت منبع باز برای تبدیل Word به HTML به صورت رایگان است. این ویژگیهای بسیاری را برای قالببندی و ویرایش اسناد Word در صورت تبدیل آنها به HTML فراهم میکند، مانند افزودن سرفصلها، فهرستها و تصاویر، فونتهای کج و پررنگ، اضافه کردن خطوط شکسته و موارد دیگر. تمام تصاویر در کلمه doc به طور پیش فرض در نتیجه HTML ایجاد می شوند. همچنین میتوانید با استفاده از تابع mammoth.extractRawText متن خام را از هر سندی استخراج کنید، با این حال، قالببندی سند اصلی را نادیده میگیرد.
یک فایل .docx موجود را به HTML تبدیل کنید
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
سبک های نقشه از Word به HTML از طریق JavaScript API
در بیشتر موارد، Mammoth سبکهای رایج Microsoft Word DOCX را از یک سند اصلی Word در نتیجه نهایی HTML ترسیم میکند. عناصری مانند Heading 1 در Word به H1 در HTML تبدیل می شوند. با این حال، Mammoth توابع زیادی را برای تبدیل سبکها از Word doc به HTML ارائه میکند.
نقشه سبک سفارشی
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);