1. Tuotteet
  2.   Tekstinkäsittely
  3.   Ruby
  4.   Word to Markdown
 
  

Ilmainen Ruby-kirjasto Microsoft Wordin muuntamiseksi Markdowniksi

Avoimen lähdekoodin Ruby-gem, joka antaa ohjelmistokehittäjille mahdollisuuden lukea ja muuntaa Microsoft Word -dokumentit (DOCX tai DOC) puhtaaksi, ihmisen luettavaksi Markdown-tiedostoksi.

Mitä on Word to Markdown?

Kun on kyse sisällön luomisesta ja verkkosivustojen rakentamisesta, tekstin rakenne on ratkaisevaa. Vaikka Microsoft Wordia käytetään laajalti asiakirjojen luomiseen, Markdown on noussut verkkokirjoittamisen suosituimmaksi formaatiksi. Sen yksinkertainen muotoilu, yhteensopivuus versiohallinnan kanssa ja kyky toimia eri alustoilla on tehnyt siitä ensisijaisen valinnan kirjoittajille, kehittäjille ja julkaisijoille. Mutta mitä tehdä, kun sinulla on kasa Word-dokumentteja, jotka haluat sisällyttää blogiisi, oppaaseesi tai sivustollesi? Niiden manuaalinen muuntaminen voi olla tylsää ja virhealtista. Tässä kohtaa Word-to-Markdown-kirjasto, Ben Balterin avoimen lähdekoodin gem, tulee apuun.

Word to Markdown on tehokas työkalu, joka automatisoi .docx-tiedostojen muuntamisen puhtaaksi, luettavaksi Markdowniksi, säästäen lukemattomia tunteja manuaalista muotoilua. Sen ydin on Ruby-gem, joka älykkäästi muuntaa Microsoft Word -dokumentit Markdowniksi. Se ei ole vain yksinkertainen tekstin poimija; se on kehittynyt työkalu, joka ymmärtää Word-dokumentin taustarakenteen ja kääntää sen vastaavaksi Markdown-syntaksiksi. Tämä tarkoittaa, että otsikot, luettelot, lihavoitu ja kursivoitu teksti sekä vielä monimutkaisemmat elementit, kuten kuvat ja taulukot, säilyvät muunnosprosessissa. Pääominaisuuksiin kuuluu:

  • CLI-työkalu erä- tai yksittäisten tiedostojen muuntamiseen
  • Selainpohjainen asiakasversio
  • Vähäiset riippuvuudet ja nopea ajonaika
  • Suunniteltu tuottamaan luettavissa oleva Markdown otsikoilla, luetteloilla, linkeillä, kuvilla ja jopa alaviitteillä
Previous Next

Aloitus Word to Markdownin kanssa

Suositeltu tapa asentaa Word to Markdown on käyttää RubyGemia. Käytä seuraavaa komentoa saadaksesi sujuvan asennuksen.

Asenna Word to Markdown Rubyn avulla

gem install word-to-markdown 
You can also download it directly from GitHub.

Muunna Word Docx Markdowniksi Rubyn avulla

Word-to-Markdown-kirjasto tarjoaa vaikuttavan listan tuetuista muunnoksista, mikä tekee siitä monipuolisen työkalun laajalle käyttöalalle. Gem jäsentää .docx-tiedostot (Office Open XML -formaatti) ja vanhemmat .doc-tiedostot, poimien tekstiä, otsikoita, luetteloita, linkkejä, taulukoita, kuvia ja muuta. Kirjasto muuntaa saumattomasti perustekstin muotoilun, varmistaen, että sisällön korostus ja rakenne pysyvät ehjinä. Tavalliset kappaleet muunnetaan oikeilla väleillä, ja Wordissä lihavoitu tai kursivoitu teksti muunnetaan helposti vastaavaksi Markdown-syntaksiksi. Seuraava esimerkki näyttää, miten ohjelmistokehittäjät voivat muuntaa Word-dokumentteja perusmuotoilun kanssa Ruby-kirjastolla.

Miten muuntaa Word Docx Markdowniksi perusmuotoilun kanssa Rubyn avulla?

require 'word-to-markdown'

# Create a new WordToMarkdown object with the path to your .docx file
w2m = WordToMarkdown.new("path/to/your/document.docx")

# Convert the document to Markdown
markdown_output = w2m.to_s

# Print the output
puts markdown_output

Kuvien ja linkkien poiminta Rubyn avulla

Kuvat ovat usein kipupiste sisällön siirrossa, mutta Word-to-Markdown-kirjasto käsittelee ne helposti. Kirjasto tarjoaa täyden tuen kuvien, taulukoiden ja linkkien poimintaan Microsoft Word -dokumenteista Ruby-sovelluksissa. Kirjasto poimii kuvat Word-dokumentista ja luo automaattisesti Markdown-kuvasyntaksin (![alt text](image_url)). Seuraava esimerkki näyttää, miten ohjelmistokehittäjät voivat poimia kuvia images/-hakemistoon ja upottaa Markdown-kuvalinkkejä tulosteeseen Ruby-API:n avulla.

Miten käsitellä kuvia Word-dokumenteissa automaattisesti Rubyn avulla?

options = { extract_images: true, image_output_dir: "images" }
md_with_images = WordToMarkdown.convert("report.docx", **options)
puts md_with_images

Taulukoiden ja hyperlinkkien poiminta Word-tiedostosta Rubyn avulla

Taulukot ovat toinen monimutkainen elementti, jonka manuaalinen muuntaminen voi olla vaikeaa. Avoimen lähdekoodin Word-to-Markdown-kirjasto tekee erinomaisen työn muuntaen Word-taulukot Markdownin putkipohjaiseen taulukkosyntaksiin muutamalla koodirivillä. Kaikki alkuperäisen Word-dokumentin hyperlinkit säilyvät ja muunnetaan oikeaksi Markdown-linkkisyntaksiksi ([linkki teksti](url)).

 Suomen