मैमथ के साथ Microsoft® Word Docs से सरल और स्वच्छ HTML बनाएं
सामग्री को मिटाए जाने के बारे में चिंता किए बिना शब्द को HTML में परिवर्तित करें।
मैमथ क्या है?
मैमथ एक उपयोग में आसान, सरल, बिना किसी झंझट के पैकेज है जिसका उपयोग Google डॉक्स, माइक्रोसॉफ्ट वर्ड और लिब्रे ऑफिस से उत्पन्न वर्ड डॉक्स को एचटीएमएल में बदलने के लिए किया जा सकता है। एक ओपन सोर्स डॉक टू एचटीएमएल कन्वर्टर के रूप में, मैमथ इस्तेमाल किए गए स्टाइल, रंग या फोंट पर ध्यान केंद्रित किए बिना किसी भी दस्तावेज़ को शब्दार्थ रूप से परिवर्तित करने के काम आता है।
मैमथ यह देखने के लिए वेब डेमो प्रदान करता है कि यह डॉक्स को एचटीएमएल में कैसे परिवर्तित करेगा, हालांकि, एचटीएमएल में इस डॉक कनवर्टर की सबसे अच्छी विशेषताओं में से एक यह है कि यह वर्डप्रेस, जावा/जेवीएम, .NET और पायथन सहित कई प्लेटफॉर्म का समर्थन करता है। यदि आपके पास कई शैलियों और रंग विशेषताओं के साथ बनाए गए जटिल दस्तावेज़ हैं, तो अंतिम परिणाम और इनपुट फ़ाइल के बीच एक बेमेल का पता लगाना संभव हो सकता है।
भले ही, साधारण वर्ड दस्तावेज़ों के लिए जिन्हें HTML में परिवर्तित करने की आवश्यकता होती है, मैमथ को काम मिल जाता है।
मैमथ के साथ शुरुआत करना
मैमथ लाइब्रेरी को स्थापित करने का अनुशंसित तरीका npm के माध्यम से है। सुचारू स्थापना के लिए कृपया निम्न कमांड का उपयोग करें
npm . के माध्यम से विशाल स्थापित करें
npm install mammoth
Microsoft® Word को HTML में मुफ़्त JavaScript API के माध्यम से कनवर्ट करें
मॉमथ एक ओपन सोर्स जावास्क्रिप्ट एपीआई है जो वर्ड को एचटीएमएल में मुफ्त में बदलने के लिए है। यह वर्ड डॉक्स को प्रारूपित और संपादित करने के लिए कई सुविधाएँ प्रदान करता है जब उन्हें HTML में परिवर्तित किया जाता है जैसे कि शीर्षक, सूचियाँ और चित्र जोड़ना, इटैलिकाइज़ और बोल्ड फ़ॉन्ट, लाइन ब्रेक जोड़ना, और बहुत कुछ। दस्तावेज़ शब्द में सभी छवियां डिफ़ॉल्ट रूप से HTML परिणाम में उत्पन्न होती हैं। आप मैमथ.extractRawText फ़ंक्शन का उपयोग करके किसी भी दस्तावेज़ से कच्चा पाठ भी निकाल सकते हैं, हालांकि, यह मूल दस्तावेज़ से स्वरूपण को अनदेखा कर देगा।
मौजूदा .docx फ़ाइल को HTML में बदलें
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
जावास्क्रिप्ट एपीआई के माध्यम से वर्ड से एचटीएमएल में मैप शैलियाँ
अधिकांश भाग के लिए, मैमथ सामान्य Microsoft Word DOCX शैलियों को मूल Word दस्तावेज़ से HTML अंतिम परिणाम में मैप करता है। Word में Heading 1 जैसे तत्वों को HTML में H1 में कनवर्ट किया जाता है। हालांकि, मैमथ वर्ड डॉक से एचटीएमएल में शैलियों को बदलने के लिए कई कार्य प्रदान करता है।
कस्टम स्टाइल मैप
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);