1. Prodotti
  2.   Elaborazione di testi
  3.   Ruby
  4.   Word to Markdown
 
  

Libreria Ruby gratuita per Convertire Microsoft Word in Markdown

Gem Ruby Open Source che permette agli sviluppatori di leggere e convertire documenti Microsoft Word (DOCX o DOC) in un file Markdown pulito e leggibile dall'uomo.

Cos'è Word to Markdown?

Quando si tratta di creare contenuti e costruire siti web, come strutturi il testo è cruciale. Sebbene Microsoft Word sia ampiamente usato per creare documenti, Markdown è emerso come il formato ideale per la scrittura web. La sua semplice formattazione, la compatibilità con il versionamento e la capacità di funzionare su diverse piattaforme lo hanno reso la scelta preferita per scrittori, sviluppatori e editori. Ma cosa fai quando hai un mucchio di documenti Word che vuoi includere sul tuo blog, nelle tue guide o sul tuo sito? Il processo manuale di conversione può essere una perdita di tempo e incline a errori. È qui che entra in gioco la libreria Word-to-Markdown, un gem open-source di Ben Balter, pronto a salvare la situazione.

Word to Markdown è uno strumento potente che automatizza la conversione di file .docx in Markdown pulito e leggibile, risparmiandoti innumerevoli ore di formattazione manuale. Al suo interno è un gem Ruby che converte intelligentemente documenti Microsoft Word in Markdown. Non è solo un semplice estrattore di testo; è uno strumento sofisticato che comprende la struttura sottostante di un documento Word e la traduce nella sintassi Markdown corrispondente. Questo significa che titoli, elenchi, testo in grassetto e corsivo, e anche elementi più complessi come immagini e tabelle sono preservati durante la conversione. Le principali caratteristiche includono:

  • Strumento CLI per conversione batch o di singolo file
  • Versione client basata su browser
  • Dipendenze minime e runtime veloce
  • Progettato per produrre Markdown leggibile con titoli, elenchi, link, immagini, anche note a piè di pagina
Previous Next

Inizio con Word to Markdown

Il modo consigliato per installare Word to Markdown è usare RubyGems. Per favore utilizza il comando seguente per un'installazione fluida.

Installa Word to Markdown via RubyGems

gem install word-to-markdown 
You can also download it directly from GitHub.

Converti Word Docx in Markdown via Ruby

La libreria Word-to-Markdown vanta una impressionante lista di conversioni supportate, rendendola uno strumento versatile per una vasta gamma di casi d'uso. Il gem analizza file .docx (formato Office Open XML) e vecchi file .doc, estraendo testo, titoli, elenchi, link, tabelle, immagini e altro. La libreria converte senza problemi la formattazione di base del testo, garantendo che l'enfasi e la struttura del contenuto rimangano intatte. I paragrafi standard sono convertiti con la corretta spaziatura, così come il testo formattato in grassetto o corsivo in Word verrà convertito nella sintassi Markdown corrispondente con facilità. L'esempio seguente dimostra come gli sviluppatori possono convertire documenti Word con formattazione di base usando la libreria Ruby.

Come Convertire Word Docx in Markdown con Formattazione Base via Ruby?

require 'word-to-markdown'

# Create a new WordToMarkdown object with the path to your .docx file
w2m = WordToMarkdown.new("path/to/your/document.docx")

# Convert the document to Markdown
markdown_output = w2m.to_s

# Print the output
puts markdown_output

Estrazione Immagini e Link via Ruby

Le immagini sono spesso un punto dolente nella migrazione di contenuti, ma la libreria Word-to-Markdown le gestisce con facilità. La libreria include il supporto completo per l'estrazione di immagini, tabelle e link da documenti Microsoft Word all'interno di applicazioni Ruby. La libreria estrae le immagini dal documento Word e genera automaticamente la sintassi immagine Markdown (![alt text](image_url)). L'esempio seguente dimostra come gli sviluppatori possano estrarre immagini nella cartella images/ e incorporare link immagine Markdown nell'output usando l'API Ruby.

Come Gestire Immagini nei Documenti Word Automaticamente via Ruby?

options = { extract_images: true, image_output_dir: "images" }
md_with_images = WordToMarkdown.convert("report.docx", **options)
puts md_with_images

Estrai Tabelle e Iperlink da File Word via Ruby

Le tabelle sono un altro elemento complesso che può essere difficile da convertire manualmente. La libreria open source Word-to-Markdown fa un ottimo lavoro nel convertire le tabelle Word nella sintassi tabellare basata su pipe di Markdown con solo un paio di righe di codice. Tutti i collegamenti ipertestuali nel documento Word originale sono preservati e convertiti nella corretta sintassi link Markdown ([link text](url)).

 Italiano