Microsoft Word को Markdown में बदलने के लिए मुफ्त रूबी लाइब्रेरी
ओपन सोर्स रूबी जेम जो सॉफ़्टवेयर डेवलपर्स को Microsoft Word दस्तावेज़ (DOCX या DOC) को साफ़, मानव‑पढ़ने योग्य Markdown फ़ाइल में पढ़ने और बदलने में सक्षम बनाता है।
Word to Markdown क्या है?
कंटेंट बनाते समय और वेबसाइट बनाते समय, टेक्स्ट को कैसे स्ट्रक्चर किया जाए, यह बहुत महत्वपूर्ण है। यद्यपि Microsoft Word दस्तावेज़ बनाने के लिए व्यापक रूप से उपयोग किया जाता है, Markdown वेब लेखन के लिए प्रमुख फ़ॉर्मेट बन गया है। इसका सरल फ़ॉर्मेटिंग, वर्ज़न कंट्रोल के साथ संगतता, और विभिन्न प्लेटफ़ॉर्म पर काम करने की क्षमता ने इसे लेखकों, डेवलपर्स और प्रकाशकों के लिए शीर्ष विकल्प बना दिया है। लेकिन क्या करें जब आपके पास कई Word दस्तावेज़ हों जिन्हें आप अपने ब्लॉग, गाइड या साइट में शामिल करना चाहते हैं? इन्हें मैन्युअल रूप से बदलने की प्रक्रिया थकाऊ और त्रुटिप्रवण हो सकती है। यहाँ Word‑to‑Markdown लाइब्रेरी, Ben Balter द्वारा विकसित एक ओपन‑सोर्स जेम, मदद के लिए आता है।
Word to Markdown एक शक्तिशाली टूल है जो .docx फ़ाइलों को साफ़, पढ़ने योग्य Markdown में स्वचालित रूप से बदलता है, जिससे आप अनगिनत घंटे की मैन्युअल फ़ॉर्मेटिंग बचा सकते हैं। मूल रूप से, यह एक रूबी जेम है जो Microsoft Word दस्तावेज़ों को बुद्धिमानी से Markdown में बदलता है। यह सिर्फ साधा टेक्स्ट एक्सट्रैक्टर नहीं है; यह एक परिष्कृत टूल है जो Word दस्तावेज़ की अंतर्निहित संरचना को समझता है और इसे संबंधित Markdown सिंटैक्स में बदलता है। इसका मतलब है कि हेडिंग, लिस्ट, बोल्ड और इटैलिक टेक्स्ट, और यहाँ तक कि इमेज व टेबल जैसे जटिल तत्व भी बदलते समय बरकरार रहते हैं। मुख्य विशेषताएँ शामिल हैं:
- बॅच या सिंगल फ़ाइल रूपांतरण के लिए CLI टूल
- ब्राउज़र‑आधारित क्लाइंट संस्करण
- न्यूनतम निर्भरताएँ और तेज़ रन‑टाइम
- हेडिंग, लिस्ट, लिंक, इमेज और फ़ुटनोट सहित पढ़ने योग्य Markdown बनाने के लिए डिज़ाइन किया गया
Word to Markdown शुरू करना
Word to Markdown स्थापित करने का अनुशंसित तरीका RubyGems का उपयोग है। सुगम इंस्टॉलेशन के लिए नीचे दिया गया कमांड उपयोग करें।
RubyGems के माध्यम से Word to Markdown स्थापित करें
gem install word-to-markdown You can also download it directly from GitHub.Ruby के माध्यम से Word Docx को Markdown में बदलें
Word‑to‑Markdown लाइब्रेरी समर्थन योग्य रूपांतरणों की प्रभावशाली सूची रखती है, जिससे यह विभिन्न उपयोग मामलों के लिए एक बहुमुखी टूल बनता है। जेम .docx फ़ाइलों (Office Open XML फॉर्मेट) और पुराने .doc फ़ाइलों को पार्स करता है, टेक्स्ट, हेडिंग, लिस्ट, लिंक, टेबल, इमेज आदि निकालता है। लाइब्रेरी बेसिक टेक्स्ट फ़ॉर्मेटिंग को बिना किसी रुकावट के बदलती है, जिससे आपका कंटेंट का जोर और स्ट्रक्चर बना रहता है। मानक पैराग्राफ सही स्पेसिंग के साथ बदलते हैं, और Word में बोल्ड या इटैलिक फ़ॉर्मेट किया गया टेक्स्ट आसानी से संबंधित Markdown सिंटैक्स में बदल जाता है। नीचे दिया गया उदाहरण दर्शाता है कि रूबी लाइब्रेरी का उपयोग करके बेसिक टेक्स्ट फ़ॉर्मेटिंग वाले Word दस्तावेज़ को डेवलपर्स कैसे बदल सकते हैं।
Ruby के माध्यम से बेसिक फ़ॉर्मेटिंग के साथ Word Docx को Markdown में कैसे बदलें?
require 'word-to-markdown'
# Create a new WordToMarkdown object with the path to your .docx file
w2m = WordToMarkdown.new("path/to/your/document.docx")
# Convert the document to Markdown
markdown_output = w2m.to_s
# Print the output
puts markdown_output
Ruby के माध्यम से इमेज और लिंक निकालना
इमेज अक्सर कंटेंट माइग्रेशन में एक समस्या होती है, लेकिन Word‑to‑Markdown लाइब्रेरी उन्हें आसानी से संभालती है। लाइब्रेरी ने Microsoft Word दस्तावेज़ों से इमेज, टेबल और लिंक को निकालने के लिए पूर्ण समर्थन शामिल किया है, जो रूबी एप्लिकेशन के भीतर होते हैं। लाइब्रेरी Word दस्तावेज़ से इमेज निकालती है और स्वचालित रूप से Markdown इमेज सिंटैक्स () बनाती है। नीचे दिया गया उदाहरण दिखाता है कि डेवलपर्स Ruby API का उपयोग करके इमेज को images/ डायरेक्टरी में निकाल सकते हैं और आउटपुट में Markdown इमेज लिंक एम्बेड कर सकते हैं।
Ruby के माध्यम से Word दस्तावेज़ों में इमेज को स्वचालित रूप से कैसे संभालें?
options = { extract_images: true, image_output_dir: "images" }
md_with_images = WordToMarkdown.convert("report.docx", **options)
puts md_with_images
Ruby के माध्यम से Word फ़ाइल से टेबल और हाइपरलिंक निकालना
टेबल एक और जटिल तत्व है जिसे मैन्युअल रूप से बदलना कठिन हो सकता है। ओपन सोर्स Word‑to‑Markdown लाइब्रेरी Word टेबल को Markdown की पाइप‑बेस्ड टेबल सिंटैक्स में बस कुछ लाइनों के कोड से बेहतरीन रूप से बदल देती है। मूल Word दस्तावेज़ में सभी हाइपरलिंक्स बरकरार रहते हैं और सही Markdown लिंक सिंटैक्स ([link text](url)) में बदल जाते हैं।