ไลบรารี Ruby ฟรีเพื่อแปลง Microsoft Word เป็น Markdown

Gem Ruby โอเพ่นซอร์สที่ให้พลังแก่ผู้พัฒนาซอฟต์แวร์ในการอ่านและแปลงเอกสาร Microsoft Word (DOCX หรือ DOC) ให้เป็นไฟล์ Markdown ที่สะอาดและอ่านง่าย

Word to Markdown คืออะไร?

เมื่อพูดถึงการสร้างเนื้อหาและสถาปัตยกรรมเว็บไซต์ การจัดโครงสร้างข้อความของคุณเป็นสิ่งสำคัญ แม้ว่า Microsoft Word จะเป็นที่นิยมในการสร้างเอกสาร แต่ Markdown กลายเป็นรูปแบบหลักสำหรับการเขียนบนเว็บ ด้วยการฟอร์แมตที่ง่าย ความเข้ากันได้กับระบบควบคุมเวอร์ชัน และความสามารถทำงานข้ามแพลตฟอร์ม ทำให้เป็นตัวเลือกยอดนิยมสำหรับนักเขียน, นักพัฒนา, และผู้เผยแพร่ แต่คุณจะทำอย่างไรเมื่อมีเอกสาร Word จำนวนมากที่ต้องการนำไปใส่ในบล็อก, คู่มือ, หรือเว็บไซต์ของคุณ? กระบวนการแปลงด้วยตนเองอาจเป็นเรื่องน่าเบื่อและเสี่ยงต่อข้อผิดพลาด นี่คือจุดที่ไลบรารี Word-to-Markdown ซึ่งเป็น gem โอเพ่นซอร์สโดย Ben Balter เข้าช่วยเหลือ

Word to Markdown เป็นเครื่องมือที่ทรงพลัง ซึ่งอัตโนมัติการแปลงไฟล์ .docx ให้เป็น Markdown ที่สะอาดและอ่านง่าย ประหยัดเวลาการจัดรูปแบบด้วยมือเป็นจำนวนมาก ในแกนหลักเป็น gem Ruby ที่แปลงเอกสาร Microsoft Word เป็น Markdown อย่างฉลาด ไม่ใช่แค่ตัวดึงข้อความธรรมดา แต่เป็นเครื่องมือขั้นสูงที่เข้าใจโครงสร้างพื้นฐานของเอกสาร Word และแปลงเป็นไวยากรณ์ Markdown ที่สอดคล้องกัน หมายความว่าหัวเรื่อง, รายการ, ตัวหนาและตัวเอียง, รวมถึงองค์ประกอบที่ซับซ้อนเช่นรูปภาพและตาราง จะถูกเก็บไว้ระหว่างกระบวนการแปลง คุณสมบัติหลักได้แก่:

  • เครื่องมือ CLI สำหรับการแปลงหลายไฟล์หรือไฟล์เดียว
  • เวอร์ชันไคลเอนต์แบบเบราว์เซอร์
  • การพึ่งพาต่ำสุดและรันไทม์เร็ว
  • ออกแบบเพื่อผลิต Markdown ที่อ่านง่ายพร้อมหัวเรื่อง, รายการ, ลิงก์, รูปภาพ, แม้แต่หมายเหตุท้ายหน้า
Previous Next

เริ่มต้นใช้งาน Word to Markdown

วิธีที่แนะนำในการติดตั้ง Word to Markdown คือใช้ RubyGems กรุณาใช้คำสั่งต่อไปนี้สำหรับการติดตั้งที่ราบรื่น

ติดตั้ง Word to Markdown ผ่าน RubyGems

gem install word-to-markdown 
You can also download it directly from GitHub.

แปลง Word Docx เป็น Markdown ผ่าน Ruby

ไลบรารี Word-to-Markdown มีรายการการแปลงที่รองรับอย่างน่าประทับใจ ทำให้เป็นเครื่องมือที่หลากหลายสำหรับการใช้งานหลายรูปแบบ gem นี้สามารถพาร์สไฟล์ .docx (รูปแบบ Office Open XML) และไฟล์ .doc เก่า, ดึงข้อความ, หัวเรื่อง, รายการ, ลิงก์, ตาราง, รูปภาพ และอื่น ๆ ไลบรารีแปลงการจัดรูปแบบข้อความพื้นฐานได้อย่างราบรื่น ทำให้การเน้นและโครงสร้างของเนื้อหาของคุณคงอยู่ตามเดิม ย่อหน้ามาตรฐานจะถูกแปลงพร้อมการเว้นระยะที่ถูกต้อง รวมถึงข้อความที่จัดรูปแบบเป็นตัวหนาหรือเอียงใน Word จะถูกแปลงเป็นไวยากรณ์ Markdown ที่สอดคล้องอย่างง่าย ตัวอย่างต่อไปนี้แสดงว่าผู้พัฒนาซอฟต์แวร์สามารถแปลงเอกสาร Word พร้อมการจัดรูปแบบข้อความพื้นฐานโดยใช้ไลบรารี Ruby ได้อย่างไร

วิธีแปลง Word Docx เป็น Markdown พร้อมการจัดรูปแบบพื้นฐานผ่าน Ruby?

require 'word-to-markdown'

# Create a new WordToMarkdown object with the path to your .docx file
w2m = WordToMarkdown.new("path/to/your/document.docx")

# Convert the document to Markdown
markdown_output = w2m.to_s

# Print the output
puts markdown_output

การดึงรูปภาพและลิงก์ผ่าน Ruby

รูปภาพมักเป็นจุดที่ทำให้การย้ายเนื้อหายาก แต่ไลบรารี Word-to-Markdown จัดการได้อย่างง่ายดาย ไลบรารีได้รวมการสนับสนุนเต็มรูปแบบสำหรับการดึงรูปภาพ, ตารางและลิงก์จากเอกสาร Microsoft Word ภายในแอปพลิเคชัน Ruby ไลบรารีดึงรูปภาพจากเอกสาร Word และสร้างไวยากรณ์รูปภาพ Markdown โดยอัตโนมัติ (![alt text](image_url)) ตัวอย่างต่อไปนี้แสดงว่าผู้พัฒนาซอฟต์แวร์สามารถดึงรูปภาพไปยังไดเรกทอรี images/ และฝังลิงก์รูปภาพ Markdown ในผลลัพธ์โดยใช้ Ruby API ได้อย่างไร

วิธีจัดการรูปภาพในเอกสาร Word อย่างอัตโนมัติผ่าน Ruby?

options = { extract_images: true, image_output_dir: "images" }
md_with_images = WordToMarkdown.convert("report.docx", **options)
puts md_with_images

ดึงตารางและไฮเปอร์ลิงก์จากไฟล์ Word ผ่าน Ruby

ตารางเป็นอีกหนึ่งองค์ประกอบที่ซับซ้อนซึ่งยากต่อการแปลงด้วยตนเอง ไลบรารี Word-to-Markdown โอเพ่นซอร์สทำงานได้ยอดเยี่ยมในการแปลงตาราง Word ให้เป็นไวยากรณ์ตารางแบบ pipe ของ Markdown ด้วยเพียงไม่กี่บรรทัดของโค้ด ลิงก์ทั้งหมดในเอกสาร Word ดั้งเดิมจะถูกเก็บไว้และแปลงเป็นไวยากรณ์ลิงก์ Markdown ที่ถูกต้อง ([link text](url))

 ไทย