Bezmaksas Ruby bibliotēka, lai pārveidotu Microsoft Word uz Markdown
Atvērtā koda Ruby gems, kas ļauj izstrādātājiem lasīt un pārveidot Microsoft Word dokumentus (DOCX vai DOC) tīrā, cilvēkam lasāmā Markdown failā.
Kas ir Word uz Markdown?
Izveidojot saturu un veidojot tīmekļa lapas, teksta struktūra ir izšķiroša. Lai gan Microsoft Word ir plaši izmantots dokumentu izveidei, Markdown ir izcēlies kā galvenais formāts tīmekļa rakstīšanai. Vienkāršais formatējums, saderība ar versiju kontroli un spēja darboties dažādās platformās ir padarījusi to par pirmo izvēli rakstniekiem, izstrādātājiem un izdevējiem. Bet kā rīkoties, ja jums ir daudz Word dokumentu, kurus vēlaties iekļaut savā blogā, rokasgrāmatās vai mājaslapā? Manuāls šo pārvēršanas process var kļūt par nepatīkamu un kļūdainu brīnumzvēri. Šeit nāk Word-to-Markdown bibliotēka, atvērtā koda gems, ko izveidoja Ben Balters.
Word uz Markdown ir spēcīgs rīks, kas automatizē .docx failu pārveidi tīrā, lasāmā Markdown, ietaupot nenovērtējamas stundas manuālam formatējumam. Tā kodolā tas ir Ruby gems, kas inteliģenti pārveido Microsoft Word dokumentus uz Markdown. Tas nav tikai vienkāršs teksta izguvējs; tas ir izsmalcināts rīks, kas saprot Word dokumenta struktūru un pārtulko to atbilstošajā Markdown sintaksē. Tas nozīmē, ka virsraksti, saraksti, treknraksti, slīpraksti, kā arī sarežģītākie elementi, piemēram attēli un tabulas, tiek saglabāti pārveides procesā. Galvenās funkcijas ietver:
- CLI rīks, lai pārvērstu vairākus vai vienu failu
- Klienta versija, kas balstīta uz pārlūkprogrammu
- Minimālas atkarības un ātrs izpildlaiks
- Veidots, lai radītu lasāmu Markdown ar virsrakstiem, sarakstiem, saitēm, bildēm, pat kājūkām
Sākums ar Word uz Markdown
Ieteicamais veids, kā instalēt Word uz Markdown, ir izmantojot RubyGems. Lūdzu, izmantojiet zemāk norādīto komandu ļaujot instalēšanu vienkārši izveidot.
Instalēt Word uz Markdown, izmantojot RubyGems
gem install word-to-markdown You can also download it directly from GitHub.Pārveidot Word Docx uz Markdown, izmantojot Ruby
Word-to-Markdown bibliotēka lepojas ar iespaidīgu sarakstu atbalstītajām pārveidošanām, padarot to par daudzpusīgu rīku dažādiem lietojumiem. Gems analizē .docx failus (Office Open XML formāts) un vecākus .doc failus, izguvējot tekstu, virsrakstus, sarakstus, saites, tabulas, attēlus un citus elementus. Bibliotēka bezrūpīgi pārveido pamata teksta formatējumu, nodrošinot, ka jūsu saturā izceltās daļas un struktūra saglabājas. Standarta rindkopas tiek pārveidotas ar pareizu atstarpi, kā arī teksts, kas ir formatēts treknrakstā vai slīprakstā Word, tiks pārveidots uz atbilstošu Markdown sintaksi bez problēmām. Zemāk esošais piemērs demonstrē, kā programmatūras izstrādātāji var pārveidot Word dokumentus ar pamata teksta formatējumu, izmantojot Ruby bibliotēku.
Kā pārveidot Word Docx uz Markdown ar pamata formatēšanu, izmantojot Ruby?
require 'word-to-markdown'
# Create a new WordToMarkdown object with the path to your .docx file
w2m = WordToMarkdown.new("path/to/your/document.docx")
# Convert the document to Markdown
markdown_output = w2m.to_s
# Print the output
puts markdown_output
Attēlu un saišu izguve, izmantojot Ruby
Attēli bieži vien ir sāpīgums satura migrācijas procesā, bet Word-to-Markdown bibliotēka tos apstrādā ar vieglumu. Bibliotēka ietver pilnu atbalstu attēlu, tabulu un saišu izguvei no Microsoft Word dokumentiem Ruby lietojumprogrammās. Bibliotēka izguvē attēlus no Word dokumenta un automātiski ģenerē Markdown attēla sintaksi (). Zemāk esošais piemērs demonstrē, kā programmatūras izstrādātāji var izguvēt attēlus uz attēlu/ direktorijas un iekļaut Markdown attēlu saites izvadē, izmantojot Ruby API.
Kā automātiski apstrādāt attēlus Word dokumentos, izmantojot Ruby?
options = { extract_images: true, image_output_dir: "images" }
md_with_images = WordToMarkdown.convert("report.docx", **options)
puts md_with_images
Izgūt tabulas un hipersaites no Word faila, izmantojot Ruby
Tabulas ir vēl viens sarežģīts elements, ko var būt grūti pārveidot manuāli. Atvērtā koda Word-to-Markdown bibliotēka lieliski pārveido Word tabulas uz Markdown caurulju tabulas sintaksi, izmantojot tikai dažas koda rindas. Visi ipasaiti oriģināla Word dokumentā tiek saglabāti un pārveidoti uz pareizo Markdown saišu sintaksi ([link text](url)).