مكتبة روبي مجانية لتحويل Microsoft Word إلى Markdown
جيم روبي مفتوح المصدر يمكّن مطوري البرمجيات من قراءة وتحويل مستندات Microsoft Word (DOCX أو DOC) إلى ملف Markdown نظيف وسهل القراءة للإنسان.
ما هو Word to Markdown؟
عندما يتعلق الأمر بإنشاء المحتوى وبناء المواقع، فإن طريقة تنظيم النص أمر حاسم. على الرغم من أن Microsoft Word يُستخدم على نطاق واسع لإنشاء المستندات، فقد ظهر Markdown كالصيغة المفضلة لكتابة الويب. تنسيقه البسيط، وتوافقه مع أنظمة التحكم في الإصدارات، وقدرته على العمل عبر منصات مختلفة جعله خيارًا رئيسيًا للكتاب، المطورين، والناشرين. ولكن ماذا تفعل عندما يكون لديك مجموعة من مستندات Word تريد تضمينها في مدونتك، أو في أدلتك، أو على موقعك؟ العملية اليدوية لتحويلها يمكن أن تكون كابوسًا شاقًا ومعرضًا للأخطاء. هنا يأتي مكتبة Word-to-Markdown، جيم مفتوح المصدر من تطوير Ben Balter، لتقديم المساعدة.
Word to Markdown هو أداة قوية تُautomate تحويل ملفات .docx إلى Markdown نظيفة وقابلة للقراءة، موفرة لك ساعات لا تُحصى من التنسيق اليدوي. في جوهرها، هو جيم روبي يحول مستندات Microsoft Word إلى Markdown بذكاء. ليس مجرد مُستخرج نص بسيط؛ بل أداة متطورة تفهم بنية مستند Word الأساسية وتترجمها إلى صِيغَة Markdown المقابلة. هذا يعني أن العناوين، القوائم، النص العريض والمائل، وحتى العناصر الأكثر تعقيدًا مثل الصور والجداول تُحافظ عليها عملية التحويل. تشمل الميزات الرئيسية:
- أداة CLI لتحويل دفعي أو ملف واحد
- نسخة عميل تعتمد على المتصفح
- اعتماديات قليلة ووقت تشغيل سريع
- مصمم لإنتاج Markdown قابل للقراءة مع العناوين، القوائم، الروابط، الصور، وحتى الحواشي
البدء مع Word to Markdown
الطريقة الموصى بها لتثبيت Word to Markdown هي باستخدام RubyGems. يرجى استخدام الأمر التالي لتثبيت سلس.
تثبيت Word to Markdown عبر RubyGems
gem install word-to-markdown You can also download it directly from GitHub.تحويل Word Docx إلى Markdown عبر Ruby
تفتخر مكتبة Word-to-Markdown بقائمة مثيرة للإعجاب من التحويلات المدعومة، مما يجعلها أداة متعددة الاستخدامات لمجموعة واسعة من الحالات. يقوم الجيم بتحليل ملفات .docx (تنسيق Office Open XML) وملفات .doc القديمة، مستخرجًا النص، العناوين، القوائم، الروابط، الجداول، الصور، وأكثر. تقوم المكتبة بتحويل تنسيقات النص الأساسية بسلاسة، مما يضمن بقاء تأكيد المحتوى وبنيته كما هي. يتم تحويل الفقرات القياسية مع المسافات الصحيحة، كما يُحول النص المنسق كعريض أو مائل في Word إلى صِيغَة Markdown المقابلة بسهولة. يوضح المثال التالي كيف يمكن للمطورين تحويل مستندات Word مع تنسيق نص أساسي باستخدام مكتبة Ruby.
كيفية تحويل Word Docx إلى Markdown مع تنسيق أساسي عبر Ruby؟
require 'word-to-markdown'
# Create a new WordToMarkdown object with the path to your .docx file
w2m = WordToMarkdown.new("path/to/your/document.docx")
# Convert the document to Markdown
markdown_output = w2m.to_s
# Print the output
puts markdown_output
استخراج الصور والروابط عبر Ruby
الصور غالبًا ما تكون نقطة ألم في نقل المحتوى، لكن مكتبة Word-to-Markdown تتعامل معها بسهولة. تضم المكتبة دعمًا كاملاً لاستخراج الصور، الجداول والروابط من مستندات Microsoft Word داخل تطبيقات Ruby. تقوم المكتبة باستخراج الصور من مستند Word وتولد تلقائيًا صِيغَة صورة Markdown (). يوضح المثال التالي كيف يمكن للمطورين استخراج الصور إلى دليل images/ وتضمين روابط صور Markdown في الناتج باستخدام واجهة برمجة تطبيقات Ruby.
كيفية التعامل مع الصور في مستندات Word تلقائيًا عبر Ruby؟
options = { extract_images: true, image_output_dir: "images" }
md_with_images = WordToMarkdown.convert("report.docx", **options)
puts md_with_images
استخراج الجداول والروابط الفائقة من ملف Word عبر Ruby
الجداول هي عنصر معقد آخر قد يكون صعب التحويل يدويًا. تقوم مكتبة Word-to-Markdown المفتوحة المصدر بعمل ممتاز في تحويل جداول Word إلى صِيغَة الجداول القائمة على الأنابيب في Markdown باستخدام بضعة أسطر من الكود فقط. جميع الروابط الفائقة في مستند Word الأصلي تُحافظ عليها وتُحول إلى صِيغَة رابط Markdown الصحيحة ([link text](url)).