Microsoft Word‑u Markdown‑a çevirmək üçün Pulsuz Ruby Kitabxanası
Açıq mənbə Ruby Gem‑i, proqramçılara Microsoft Word sənədlərini (DOCX və ya DOC) təmiz, insan tərəfindən oxunaqlı Markdown faylına oxumaq və çevirmək imkanı verir.
Word to Markdown nədir?
Kontent yaratmaq və veb saytı qurarkən mətninizi necə strukturlaşdırdiyiniz vacibdir. Microsoft Word sənədlərin yaradılmasında geniş istifadə olunmasına baxmayaraq, Markdown veb yazısı üçün üstünlük edilən format halına gəldi. Sadə formatlaması, versiya nəzarəti ilə uyğunluğu və müxtəlif platformalarda işləmə qabiliyyəti onu yazıçılar, inkişaf etdiricilər və nəşriyyatçılar üçün ən populyar seçim edir. Amma blogunuza, təlimatlarınızda və ya saytınıza daxil etmək istədiyiniz bir çox Word sənədiniz olduğunda nə edəcəksiniz? Onları əl ilə çevirmək çətin və səhvlə dolu bir iş ola bilər. Burada Ben Balter‑in açıq mənbə gem‑i olan Word-to-Markdown kitabxanası kömək edir.
Word to Markdown, .docx fayllarını təmiz, oxunaqlı Markdown‑a avtomatlaşdırılmış şəkildə çevirən güclü bir vasitədir, əl ilə formatlama üçün sonsuz saatları qənaət edir. Əsas konsepsiyası, Microsoft Word sənədlərini ağıllı şəkildə Markdown‑a çevirən Ruby gem‑idir. Bu, sadə mətn çıxarıcı deyil; Word sənədinin əsas strukturunu anlayan və onu uyğun Markdown sintaksisinə çevirən inkişaf etmiş bir vasitədir. Bu, başlıqlar, siyahılar, qalın və italik mətn, hətta şəkillər və cədvəllər kimi daha mürəkkəb elementlərin çevrilmə prosesində qorunmasını təmin edir. Əsas xüsusiyyətlər daxildir:
- Toplu və ya tək fayl çevrilməsi üçün CLI aləti
- Brauzer əsaslı müştəri versiyası
- Ən az asılılıqlar və sürətli icra müddəti
- Başlıqlar, siyahılar, keçidlər, şəkillər və hətta ayaq qeydləri ilə oxunaqlı Markdown yaratmaq üçün dizayn edilmişdir
Word to Markdown ilə Başlamaq
Word to Markdown‑i quraşdırmağın tövsiyə olunan yolu RubyGems‑dir. Problemsiz quraşdırma üçün aşağıdakı əmri istifadə edin.
RubyGems vasitəsilə Word to Markdown quraşdırın
gem install word-to-markdown You can also download it directly from GitHub.Word Docx‑i Ruby vasitəsilə Markdown‑a çevirmək
Word-to-Markdown kitabxanası, geniş çeşiddə konvertasiyaları dəstəkləyən təsirli bir siyahıya sahibdir və müxtəlif istifadə halları üçün çox yönlü bir alət edir. Gem, .docx fayllarını (Office Open XML formatı) və köhnə .doc fayllarını pars edir, mətn, başlıqlar, siyahılar, keçidlər, cədvəllər, şəkillər və daha çoxunu çıxarır. Kitabxana əsas mətn formatlamasını problemsiz çevirir, məzmununuzun vurğulanması və strukturu qorunur. Standart paraqraflar düzgün boşluqlarla, Word‑də qalın və ya italik formatlanmış mətn isə asanlıqla uyğun Markdown sintaksisinə çevrilir. Aşağıdakı nümunə Ruby kitabxanası ilə əsas mətn formatlamalı Word sənədlərinin necə çevrildiyini göstərir.
Ruby vasitəsilə əsas formatlama ilə Word Docx‑i Markdown‑a necə çevirmək?
require 'word-to-markdown'
# Create a new WordToMarkdown object with the path to your .docx file
w2m = WordToMarkdown.new("path/to/your/document.docx")
# Convert the document to Markdown
markdown_output = w2m.to_s
# Print the output
puts markdown_output
Şəkil & Keçidlərin Ruby vasitəsilə çıxarılması
Şəkillər məzmun miqrasiyasında tez-tez çətinlik yaradır, lakin Word-to-Markdown kitabxanası onları asanlıqla idarə edir. Kitabxana Microsoft Word sənədlərindən Ruby tətbiqlərində şəkilləri, cədvəlləri və keçidləri çıxarmaq üçün tam dəstək əlavə edib. Kitabxana şəkilləri Word sənədindən çıxarır və avtomatik olaraq Markdown şəkil sintaksisini () yaradır. Aşağıdakı nümunə Ruby API‑ni istifadə edərək şəkilləri images/ qovluğuna çıxararaq nəticəyə Markdown şəkil keçidləri əlavə etməyi nümayiş etdirir.
Ruby vasitəsilə Word sənədlərində şəkillərlə avtomatik necə işləmək?
options = { extract_images: true, image_output_dir: "images" }
md_with_images = WordToMarkdown.convert("report.docx", **options)
puts md_with_images
Word fayldan Cədvəllərin və Hiperkeçidlərin Ruby vasitəsilə çıxarılması
Cədvəllər də başqa bir mürəkkəb elementdir və əl ilə çevirmək çətin ola bilər. Açıq mənbə Word-to-Markdown kitabxanası, yalnız bir neçə kod sətiri ilə Word cədvəllərini Markdown‑ın boru‑əsaslı cədvəl sintaksisinə çevirmə işini mükəmməl şəkildə yerinə yetirir. Orijinal Word sənədindəki bütün hiperkeçidlər saxlanılır və uyğun Markdown keçid sintaksisinə ([link text](url)) çevrilir.