1. Produk
  2.   Pemprosesan perkataan
  3.   Ruby
  4.   Word to Markdown
 
  

Perpustakaan Ruby Percuma untuk Menukar Microsoft Word ke Markdown

Gem Ruby Sumber Terbuka yang Memberi Kuasa kepada Pembangun Perisian untuk Membaca dan Menukar Dokumen Microsoft Word (DOCX atau DOC) menjadi Fail Markdown yang Bersih dan Mudah Dibaca Manusia.

Apakah Word to Markdown?

Apabila bercakap tentang mencipta kandungan dan membina laman web, cara anda menyusun teks adalah penting. Walaupun Microsoft Word banyak digunakan untuk mencipta dokumen, Markdown telah muncul sebagai format pilihan untuk penulisan web. Format yang mudah, keserasian dengan kawalan versi, dan keupayaannya untuk bekerja merentasi pelbagai platform menjadikannya pilihan utama bagi penulis, pembangun, dan penerbit. Tetapi apa yang anda lakukan apabila anda mempunyai sekumpulan dokumen Word yang ingin dimasukkan ke dalam blog anda, panduan, atau laman? Proses manual menukarnya boleh menjadi mimpi ngeri yang membosankan dan penuh kesilapan. Di sinilah perpustakaan Word-to-Markdown, gem sumber terbuka oleh Ben Balter, membantu.

Word to Markdown ialah alat yang kuat yang mengautomasikan penukaran fail .docx menjadi Markdown yang bersih dan mudah dibaca, menjimatkan anda beribu-ribu jam penformatan manual. Pada intinya, ia adalah gem Ruby yang secara bijak menukar dokumen Microsoft Word menjadi Markdown. Ia bukan sekadar pengekstrak teks sederhana; ia merupakan alat canggih yang memahami struktur asas dokumen Word dan menterjemahkannya ke dalam sintaks Markdown yang sepadan. Ini bermakna tajuk, senarai, teks tebal dan condong, malah elemen lebih kompleks seperti imej dan jadual dipelihara semasa proses penukaran. Ciri utama termasuk:

  • Alat CLI untuk penukaran kumpulan atau fail tunggal
  • Versi klien berasaskan pelayar
  • Kebergantungan minimum dan masa jalan cepat
  • Direka untuk menghasilkan Markdown yang dapat dibaca dengan tajuk, senarai, pautan, imej, malah nota kaki
Previous Next

Mula Menggunakan Word to Markdown

Cara yang disarankan untuk memasang Word to Markdown ialah menggunakan RubyGems. Sila gunakan perintah berikut untuk pemasangan yang lancar.

Pasang Word to Markdown melalui RubyGems

gem install word-to-markdown 
You can also download it directly from GitHub.

Tukar Word Docx ke Markdown melalui Ruby

Perpustakaan Word-to-Markdown mempunyai senarai penukaran yang mengagumkan, menjadikannya alat serbaguna untuk pelbagai kegunaan. Gem ini mengurai fail .docx (format Office Open XML) dan fail .doc lama, mengekstrak teks, tajuk, senarai, pautan, jadual, imej, dan lain-lain. Perpustakaan ini menukar pemformatan teks asas dengan lancar, memastikan penekanan dan struktur kandungan anda tetap utuh. Perenggan standar ditukar dengan jarak yang betul serta teks yang diformat sebagai tebal atau condong dalam Word akan ditukar ke sintaks Markdown yang sepadan dengan mudah. Contoh berikut menunjukkan bagaimana pembangun perisian boleh menukar dokumen Word dengan pemformatan teks asas menggunakan perpustakaan Ruby.

Bagaimana Menukar Word Docx ke Markdown dengan Pemformatan Asas melalui Ruby?

require 'word-to-markdown'

# Create a new WordToMarkdown object with the path to your .docx file
w2m = WordToMarkdown.new("path/to/your/document.docx")

# Convert the document to Markdown
markdown_output = w2m.to_s

# Print the output
puts markdown_output

Pengekstrakan Imej & Pautan melalui Ruby

Imej sering menjadi titik masalah dalam pemindahan kandungan, tetapi perpustakaan Word-to-Markdown mengendalikan ia dengan mudah. Perpustakaan ini menyertakan sokongan lengkap untuk mengekstrak imej, jadual dan pautan dari dokumen Microsoft Word dalam aplikasi Ruby. Perpustakaan mengekstrak imej dari dokumen Word dan secara automatik menghasilkan sintaks imej Markdown (![alt text](image_url)). Contoh berikut menunjukkan bagaimana pembangun perisian dapat mengekstrak imej ke direktori images/ dan menyematkan pautan imej Markdown dalam output menggunakan API Ruby.

Bagaimana Mengendalikan Imej dalam Dokumen Word secara Automatik melalui Ruby?

options = { extract_images: true, image_output_dir: "images" }
md_with_images = WordToMarkdown.convert("report.docx", **options)
puts md_with_images

Ekstrak Jadual & Pautan Hiper dari Fail Word melalui Ruby

Jadual merupakan elemen kompleks lain yang sukar ditukar secara manual. Perpustakaan Word-to-Markdown sumber terbuka melakukan pekerjaan cemerlang menukar jadual Word ke dalam sintaks jadual berasaskan paip Markdown dengan hanya beberapa baris kod. Semua pautan hiper dalam dokumen Word asal dipelihara dan ditukar ke sintaks pautan Markdown yang betul ([link text](url)).

 Melayu