1. Produkter
  2.   Tekstbehandling
  3.   Ruby
  4.   Word to Markdown
 
  

Gratis Ruby-bibliotek for å konvertere Microsoft Word til Markdown

Åpen kildekode Ruby Gem som gir programvareutviklere muligheten til å lese og konvertere Microsoft Word-dokumenter (DOCX eller DOC) til en ren, menneskelig lesbar Markdown-fil.

Hva er Word to Markdown?

Når det gjelder å lage innhold og bygge nettsteder, er hvordan du strukturerer teksten din avgjørende. Selv om Microsoft Word er mye brukt til å lage dokumenter, har Markdown blitt det foretrukne formatet for webskriving. Den enkle formateringen, kompatibiliteten med versjonskontroll, og evnen til å fungere på tvers av ulike plattformer har gjort den til et førstevalg for skribenter, utviklere og forleggere. Men hva gjør du når du har en mengde Word-dokumenter du vil inkludere i bloggen din, i guider eller på nettstedet ditt? Den manuelle prosessen med å konvertere dem kan være en tidkrevende og feilutsatt mareritt. Det er her Word-to-Markdown-biblioteket, en åpen kildekode gem av Ben Balter, kommer til unnsetning.

Word to Markdown er et kraftfullt verktøy som automatiserer konverteringen av .docx-filer til ren, lesbar Markdown, og sparer deg utallige timer med manuell formatering. I kjernen er det en Ruby gem som intelligent konverterer Microsoft Word-dokumenter til Markdown. Det er ikke bare en enkel tekstekstraktor; det er et sofistikert verktøy som forstår den underliggende strukturen i et Word-dokument og oversetter det til tilsvarende Markdown-syntaks. Dette betyr at overskrifter, lister, fet og kursiv tekst, og også mer komplekse elementer som bilder og tabeller blir bevart under konverteringsprosessen. Hovedfunksjonene inkluderer:

  • CLI-verktøy for batch- eller enkeltfilkonvertering
  • Nettleserbasert klientversjon
  • Minimale avhengigheter og rask kjøringstid
  • Designet for å produsere lesbar Markdown med overskrifter, lister, lenker, bilder, og til og med fotnoter
Previous Next

Kom i gang med Word to Markdown

Den anbefalte måten å installere Word to Markdown på er ved å bruke RubyGems. Vennligst bruk følgende kommando for en smidig installasjon.

Installer Word to Markdown via RubyGems

gem install word-to-markdown 
You can also download it directly from GitHub.

Konverter Word Docx til Markdown via Ruby

Word-to-Markdown-biblioteket har en imponerende liste over støttede konverteringer, noe som gjør det til et allsidig verktøy for et bredt spekter av brukstilfeller. Gem-en parser .docx-filer (Office Open XML-format) og eldre .doc-filer, og henter ut tekst, overskrifter, lister, lenker, tabeller, bilder og mer. Biblioteket konverterer sømløst grunnleggende tekstformatering, og sikrer at innholdets vektlegging og struktur forblir intakt. Standardavsnitt blir konvertert med korrekt avstand, og tekst formatert som fet eller kursiv i Word blir enkelt konvertert til tilsvarende Markdown-syntaks. Følgende eksempel viser hvordan programvareutviklere kan konvertere Word-dokumenter med grunnleggende tekstformatering ved hjelp av Ruby-biblioteket.

Hvordan konvertere Word Docx til Markdown med grunnleggende formatering via Ruby?

require 'word-to-markdown'

# Create a new WordToMarkdown object with the path to your .docx file
w2m = WordToMarkdown.new("path/to/your/document.docx")

# Convert the document to Markdown
markdown_output = w2m.to_s

# Print the output
puts markdown_output

Uttrekk av bilder & lenker via Ruby

Bilder er ofte en utfordring ved innholdsmigrering, men Word-to-Markdown-biblioteket håndterer dem med letthet. Biblioteket har inkludert full støtte for å ekstrahere bilder, tabeller og lenker fra Microsoft Word-dokumenter i Ruby-applikasjoner. Biblioteket trekker ut bildene fra Word-dokumentet og genererer automatisk Markdown-bildesyntax (![alt text](image_url)). Følgende eksempel demonstrerer hvordan programvareutviklere kan ekstrahere bilder til katalogen images/ og sette inn Markdown-bildelenker i output ved hjelp av Ruby API.

Hvordan håndtere bilder i Word-dokumenter automatisk via Ruby?

options = { extract_images: true, image_output_dir: "images" }
md_with_images = WordToMarkdown.convert("report.docx", **options)
puts md_with_images

Uttrekk av tabeller & hyperlenker fra Word-fil via Ruby

Tabeller er et annet komplekst element som kan være vanskelig å konvertere manuelt. Det åpne kildekode Word-to-Markdown-biblioteket gjør en utmerket jobb med å konvertere Word-tabeller til Markdown sin rørbaserte tabellsyntaks med bare noen få kodelinjer. Alle hyperlenker i det originale Word-dokumentet bevares og konverteres til korrekt Markdown-lenkesyntaks ([link text](url)).

 Norsk