Microsoft Wordকে Markdown-এ রূপান্তর করার জন্য ফ্রি রুবি লাইব্রেরি

ওপেন সোর্স রুবি Gem, যা সফটওয়্যার ডেভেলপারদেরকে Microsoft Word ডকুমেন্ট (DOCX বা DOC)কে পরিষ্কার, মানব-পাঠযোগ্য Markdown ফাইলে পড়া এবং রূপান্তর করার ক্ষমতা দেয়।

Word to Markdown কী?

কন্টেন্ট তৈরি এবং ওয়েবসাইট গঠন করার সময় আপনার টেক্সট কিভাবে গঠন করবেন তা গুরুত্বপূর্ণ। যদিও Microsoft Word ডকুমেন্ট তৈরির জন্য ব্যাপকভাবে ব্যবহৃত হয়, তবে Markdown ওয়েব লেখার জন্য প্রধান ফরম্যাট হিসেবে উদ্ভূত হয়েছে। এর সহজ ফরম্যাটিং, ভার্সন কন্ট্রোলের সঙ্গে সামঞ্জস্য এবং বিভিন্ন প্ল্যাটফর্মে কাজ করার সক্ষমতা এটি লেখক, ডেভেলপার এবং পাবলিশারদের জন্য শীর্ষ পছন্দ করে তুলেছে। তবে আপনি যদি আপনার ব্লগ, গাইড বা সাইটে অন্তর্ভুক্ত করার জন্য প্রচুর Word ডকুমেন্ট থাকে, তখন কী করবেন? তাদের ম্যানুয়ালি রূপান্তর করার প্রক্রিয়া ক্লান্তিকর এবং ত্রুটিপ্রবণ হতে পারে। এখানে Ben Balter-এর ওপেন-সোর্স gem Word-to-Markdown লাইব্রেরি সাহায্য করে।

Word to Markdown একটি শক্তিশালী টুল, যা .docx ফাইলকে পরিষ্কার, পাঠযোগ্য Markdown-এ স্বয়ংক্রিয়ভাবে রূপান্তর করে, আপনার অগণিত ঘণ্টার ম্যানুয়াল ফরম্যাটিং সাশ্রয় করে। মূলত, এটি একটি Ruby gem, যা বুদ্ধিমত্তার সাথে Microsoft Word ডকুমেন্টকে Markdown-এ রূপান্তর করে। এটি শুধুমাত্র একটি সহজ টেক্সট এক্সট্র্যাক্টর নয়; এটি একটি উন্নত টুল, যা Word ডকুমেন্টের অন্তর্নিহিত গঠনকে বুঝে এবং তা সংশ্লিষ্ট Markdown সিনট্যাক্সে অনুবাদ করে। এর অর্থ হল শিরোনাম, তালিকা, বোল্ড এবং ইটালিক টেক্সট, এবং এমনকি ইমেজ ও টেবিলের মতো জটিল উপাদানগুলি রূপান্তর প্রক্রিয়ার সময় সংরক্ষিত থাকে। মূল বৈশিষ্ট্যগুলি অন্তর্ভুক্ত:

  • ব্যাচ বা সিঙ্গল ফাইল রূপান্তরের জন্য CLI টুল
  • ব্রাউজার-ভিত্তিক ক্লায়েন্ট সংস্করণ
  • ন্যূনতম নির্ভরতা এবং দ্রুত রানটাইম
  • শিরোনাম, তালিকা, লিঙ্ক, ইমেজ এবং এমনকি ফুটনোটসহ পাঠযোগ্য Markdown উৎপাদনের জন্য ডিজাইন করা হয়েছে
Previous Next

Word to Markdown দিয়ে শুরু করা

Word to Markdown ইনস্টল করার সুপারিশকৃত পদ্ধতি হল RubyGems ব্যবহার করা। মসৃণ ইনস্টলেশনের জন্য দয়া করে নিম্নলিখিত কমান্ড ব্যবহার করুন।

RubyGems দিয়ে Word to Markdown ইনস্টল করুন

gem install word-to-markdown 
You can also download it directly from GitHub.

Ruby ব্যবহার করে Word Docxকে Markdown-এ রূপান্তর করুন

Word-to-Markdown লাইব্রেরি সমর্থিত রূপান্তরের একটি চিত্তাকর্ষক তালিকা ধারণ করে, যা অনেক ধরনের ব্যবহার ক্ষেত্রে এটি একটি বহুমুখী টুল করে তোলে। gem .docx ফাইল (Office Open XML ফরম্যাট) এবং পুরানো .doc ফাইল বিশ্লেষণ করে, টেক্সট, শিরোনাম, তালিকা, লিঙ্ক, টেবিল, ইমেজ এবং আরও অনেক কিছু বের করে। লাইব্রেরি বেসিক টেক্সট ফরম্যাটিং নিরবচ্ছিন্নভাবে রূপান্তর করে, আপনার কন্টেন্টের জোর এবং কাঠামো অপরিবর্তিত থাকে তা নিশ্চিত করে। স্ট্যান্ডার্ড প্যারাগ্রাফগুলো সঠিক স্পেসিং সহ রূপান্তরিত হয় এবং Word-এ বোল্ড বা ইটালিক হিসেবে ফরম্যাটেড টেক্সট সহজে সংশ্লিষ্ট Markdown সিনট্যাক্সে রূপান্তরিত হয়। নিম্নের উদাহরণটি দেখায় কীভাবে সফটওয়্যার ডেভেলপাররা Ruby লাইব্রেরি ব্যবহার করে বেসিক টেক্সট ফরম্যাটিং সহ Word ডকুমেন্ট রূপান্তর করতে পারেন।

Ruby দিয়ে বেসিক ফরম্যাটিং সহ Word Docxকে Markdown-এ কীভাবে রূপান্তর করবেন?

require 'word-to-markdown'

# Create a new WordToMarkdown object with the path to your .docx file
w2m = WordToMarkdown.new("path/to/your/document.docx")

# Convert the document to Markdown
markdown_output = w2m.to_s

# Print the output
puts markdown_output

Ruby ব্যবহার করে ইমেজ ও লিঙ্ক এক্সট্র্যাকশন

ইমেজগুলি প্রায়শই কন্টেন্ট মাইগ্রেশনে একটি সমস্যাজনক অংশ, তবে Word-to-Markdown লাইব্রেরি সেগুলি সহজে হ্যান্ডেল করে। লাইব্রেরি Microsoft Word ডকুমেন্ট থেকে Ruby অ্যাপ্লিকেশনের মধ্যে ইমেজ, টেবিল এবং লিঙ্ক এক্সট্র্যাক্ট করার সম্পূর্ণ সমর্থন অন্তর্ভুক্ত করেছে। লাইব্রেরি Word ডকুমেন্ট থেকে ইমেজ বের করে এবং স্বয়ংক্রিয়ভাবে Markdown ইমেজ সিনট্যাক্স (![alt text](image_url)) তৈরি করে। নিম্নের উদাহরণটি দেখায় কীভাবে সফটওয়্যার ডেভেলপাররা ইমেজগুলো images/ ডিরেক্টরিতে এক্সট্র্যাক্ট করে এবং Ruby API ব্যবহার করে আউটপুটে Markdown ইমেজ লিঙ্ক এম্বেড করে।

Ruby দিয়ে Word ডকুমেন্টে ইমেজ স্বয়ংক্রিয়ভাবে কীভাবে হ্যান্ডেল করবেন?

options = { extract_images: true, image_output_dir: "images" }
md_with_images = WordToMarkdown.convert("report.docx", **options)
puts md_with_images

Ruby ব্যবহার করে Word ফাইল থেকে টেবিল ও হাইপারলিঙ্ক এক্সট্র্যাকশন

টেবিলগুলি আরেকটি জটিল উপাদান, যা ম্যানুয়ালি রূপান্তর করা কঠিন হতে পারে। ওপেন সোর্স Word-to-Markdown লাইব্রেরি কয়েকটি কোড লাইনের মাধ্যমে Word টেবিলগুলোকে Markdown-এর pipe-ভিত্তিক টেবিল সিনট্যাক্সে রূপান্তর করতে অসাধারণ কাজ করে। মূল Word ডকুমেন্টের সব হাইপারলিঙ্ক সংরক্ষিত থাকে এবং সঠিক Markdown লিঙ্ক সিনট্যাক্সে ([link text](url)) রূপান্তরিত হয়।

 বাংলা