1. Prodotti
  2.   Elaborazione di testi
  3.   .NET
  4.   Dotnet-Mammoth
 
  

Libreria C# .NET per la creazione di documenti di elaborazione testi

L'API C# .NET open source consente agli sviluppatori di software di caricare e convertire documenti Microsoft Word, Google Docs e LibreOffice in HTML gratuitamente.

Che cos'è Dotnet-Mammoth?

Nel mondo moderno dello scambio di informazioni, la capacità di convertire facilmente i documenti da un formato all'altro è diventata fondamentale. Che si tratti di archiviazione, condivisione o anche solo di mantenimento dell'integrità dei dati, disporre di uno strumento affidabile di conversione dei documenti può fare la differenza. È qui che entra in gioco la libreria Dotnet-Mammoth, che offre una soluzione potente e versatile per convertire facilmente i documenti. Utilizzando la libreria gli utenti possono convertire documenti storici o record importanti in file HTML accessibili e ricercabili.

La libreria Dotnet-Mammot è un wrapper .NET attorno alla popolare libreria JavaScript mammoth.js. Il suo scopo principale è semplificare il processo di conversione di documenti complessi, principalmente file DOCX e DOC, in HTML, consentendo una transizione graduale tra diversi formati. Ciò può essere particolarmente utile quando si ha a che fare con documenti in applicazioni in cui HTML è il mezzo preferito, come applicazioni Web o sistemi di gestione dei contenuti. Supporta funzionalità come intestazioni, elenchi, supporto per la mappatura personalizzabile, formattazione della tabella, note a piè di pagina e note di chiusura, immagini, collegamenti, interruzioni di riga, caselle di testo, commenti, grassetto/corsivo/sottolineato, barrato e molto altro.

La libreria Dotnet-Mammoth si rivela una risorsa preziosa per gli sviluppatori di software che necessitano di funzionalità di conversione di documenti robuste e accurate all'interno delle loro applicazioni .NET. Importa e pubblica facilmente documenti Word su siti Web o blog preservandone la formattazione. Il suo supporto per stili complessi, facilità d'uso e configurabilità lo rendono la scelta ideale per la gestione delle trasformazioni dei documenti. Sfruttando la potenza della libreria, gli sviluppatori possono sbloccare un mondo di possibilità nella conversione fluida di documenti complessi mantenendone l'integrità visiva e strutturale.

Previous Next

Introduzione a Dotnet-Mammoth

Il modo consigliato per installare Dotnet-Mammoth è utilizzare NuGet. Utilizza il seguente comando per un'installazione fluida.

Installa Dotnet-Mammoth da NuGet

 Install-Package Mammoth
Puoi anche scaricarlo direttamente da GitHub.

Conversione di documenti Word in HTML tramite C#

La libreria open source Dotnet-Mammoth offre agli sviluppatori di software la possibilità di caricare e convertire documenti DOCX di Microsoft Word in HTML pulito e accurato all'interno delle applicazioni .NET. La libreria eccelle nella gestione dei documenti Microsoft Word (sia in formato .docx che .doc), rendendola la scelta ideale per le applicazioni che gestiscono un'ampia gamma di documentazione. Vanta una notevole precisione nella conversione dei documenti. Traduce meticolosamente non solo il contenuto testuale ma anche vari elementi di stile, come intestazioni, elenchi, tabelle e persino immagini incorporate. L'esempio seguente mostra con quanta facilità gli sviluppatori di software possono caricare e convertire documenti Word in formato file HTML utilizzando i comandi C#.

Come convertire un documento Word in file HTML tramite API C#?

using DotnetMammoth;

class Program
{
    static void Main(string[] args)
    {
        var converter = new DocumentConverter();
        var result = converter.ConvertToHtml("path/to/document.docx");
        
        Console.WriteLine(result.Value);
    }
}

Estrai testo e gestisci documenti complessi

La libreria open source Dotnet-Mammoth ha fornito il supporto completo per la gestione di documenti complessi all'interno delle applicazioni C#. Alcuni documenti possono essere incredibilmente complessi, con formattazione complessa, tabelle, immagini e altro ancora. La libreria affronta questa complessità in modo efficace, garantendo che anche i documenti con layout complessi vengano convertiti con precisione. È anche molto semplice estrarre il testo non elaborato del documento utilizzando ExtractRawText. L'esempio seguente mostra come gli sviluppatori di software possono estrarre testo da un documento Word .docx all'interno di applicazioni .NET.

Come estrarre il testo non elaborato di un documento Word all'interno delle app C#?

var converter = new DocumentConverter();
var result = converter.ExtractRawText("document.docx");
var html = result.Value; // The raw text
var warnings = result.Warnings; // Any warnings during conversion

Precisione, conservazione e stile personalizzato

Una delle preoccupazioni principali durante la conversione dei documenti è mantenere la fedeltà del contenuto originale. La libreria Dotnet-Mammoth eccelle in questo aspetto, sforzandosi di preservare la formattazione, gli stili e la struttura del documento sorgente nel modo più accurato possibile nell'HTML risultante. La libreria offre la possibilità di applicare uno stile personalizzato durante il processo di conversione, garantendo che l'HTML risultante sia in linea con gli standard di progettazione della tua applicazione. Questo livello di personalizzazione migliora la coerenza dei tuoi contenuti su diverse piattaforme.

 Italiano