1. Produkte
  2.   Textverarbeitung
  3.   .NET
  4.   Dotnet-Mammoth
 
  

C# .NET-Bibliothek zum Erstellen von Textverarbeitungsdokumenten

Die Open-Source-C#-.NET-API ermöglicht Softwareentwicklern das kostenlose Laden und Konvertieren von Microsoft Word-, Google Docs- und LibreOffice-Dokumenten in HTML.

Was ist Dotnet-Mammoth?

In der modernen Welt des Informationsaustauschs ist die Fähigkeit, Dokumente nahtlos von einem Format in ein anderes zu konvertieren, von größter Bedeutung geworden. Ganz gleich, ob es um die Archivierung, den Austausch oder einfach nur um die Aufrechterhaltung der Datenintegrität geht, ein zuverlässiges Dokumentkonvertierungstool kann den entscheidenden Unterschied machen. Hier kommt die Dotnet-Mammoth-Bibliothek ins Spiel und bietet eine leistungsstarke und vielseitige Lösung für die einfache Konvertierung von Dokumenten. Mithilfe der Bibliothek können Benutzer historische Dokumente oder wichtige Aufzeichnungen in zugängliche und durchsuchbare HTML-Dateien konvertieren.

Die Dotnet-Mammot-Bibliothek ist ein .NET-Wrapper um die beliebte JavaScript-Bibliothek mammoth.js. Sein Hauptzweck besteht darin, den Prozess der Konvertierung komplexer Dokumente, hauptsächlich DOCX- und DOC-Dateien, in HTML zu vereinfachen und einen reibungslosen Übergang zwischen verschiedenen Formaten zu ermöglichen. Dies kann besonders praktisch sein, wenn Sie mit Dokumenten in Anwendungen arbeiten, bei denen HTML das bevorzugte Medium ist, wie z. B. Webanwendungen oder Content-Management-Systeme. Es unterstützt Funktionen wie Überschriften, Listen, anpassbare Zuordnungsunterstützung, Formatierung der Tabelle, Fußnoten und Endnoten, Bilder, Links, Zeilenumbrüche, Textfelder, Kommentare, Fett/Kursiv/Unterstrichen, Durchgestrichen und vieles mehr.

Die Dotnet-Mammoth-Bibliothek erweist sich als wertvolles Hilfsmittel für Softwareentwickler, die robuste und genaue Dokumentkonvertierungsfunktionen in ihren .NET-Anwendungen benötigen. Es importiert und veröffentlicht problemlos Word-Dokumente auf Websites oder Blogs und behält dabei deren Formatierung bei. Seine Unterstützung für komplexes Styling, Benutzerfreundlichkeit und Konfigurierbarkeit machen es zu einer ersten Wahl für die Handhabung von Dokumenttransformationen. Durch die Nutzung der Leistungsfähigkeit der Bibliothek können Entwickler eine Welt voller Möglichkeiten für die nahtlose Konvertierung komplexer Dokumente unter Beibehaltung ihrer visuellen und strukturellen Integrität erschließen.

Previous Next

Erste Schritte mit Dotnet-Mammoth

Die empfohlene Methode zur Installation von Dotnet-Mammoth ist die Verwendung von NuGet. Für eine reibungslose Installation verwenden Sie bitte den folgenden Befehl.

Installieren Sie Dotnet-Mammoth von NuGet

 Install-Package Mammoth
Sie können es auch direkt von GitHub herunterladen.

Konvertierung von Word-Dokumenten in HTML über C#

Die Open-Source-Bibliothek Dotnet-Mammoth gibt Softwareentwicklern die Möglichkeit, Microsoft Word DOCX-Dokumente in .NET-Anwendungen zu laden und in sauberes und genaues HTML zu konvertieren. Die Bibliothek zeichnet sich durch die Verarbeitung von Microsoft Word-Dokumenten (sowohl im .docx- als auch im .doc-Format) aus und ist somit die ideale Wahl für Anwendungen, die eine breite Palette von Dokumentationen verarbeiten. Es zeichnet sich durch eine bemerkenswerte Genauigkeit bei der Konvertierung von Dokumenten aus. Es übersetzt nicht nur den Textinhalt, sondern auch verschiedene Stilelemente wie Überschriften, Listen, Tabellen und sogar eingebettete Bilder sorgfältig. Das folgende Beispiel zeigt, wie einfach Softwareentwickler Word-Dokumente mithilfe von C#-Befehlen laden und in das HTML-Dateiformat konvertieren können.

Wie konvertiere ich ein Word-Dokument über die C#-API in eine HTML-Datei?

using DotnetMammoth;

class Program
{
    static void Main(string[] args)
    {
        var converter = new DocumentConverter();
        var result = converter.ConvertToHtml("path/to/document.docx");
        
        Console.WriteLine(result.Value);
    }
}

Text extrahieren und komplexe Dokumente bearbeiten

Die Open-Source-Bibliothek Dotnet-Mammoth bietet umfassende Unterstützung für die Verarbeitung komplexer Dokumente in C#-Anwendungen. Manche Dokumente können unglaublich komplex sein und komplexe Formatierungen, Tabellen, Bilder und mehr enthalten. Die Bibliothek bewältigt diese Komplexität effektiv und stellt sicher, dass selbst Dokumente mit komplizierten Layouts präzise konvertiert werden. Mit ExtractRawText ist es auch sehr einfach, den Rohtext des Dokuments zu extrahieren. Das folgende Beispiel zeigt, wie Softwareentwickler Text aus einem Word-.docx-Dokument in .NET-Anwendungen extrahieren können.

Wie extrahiere ich den Rohtext eines Word-Dokuments in C#-Apps?

var converter = new DocumentConverter();
var result = converter.ExtractRawText("document.docx");
var html = result.Value; // The raw text
var warnings = result.Warnings; // Any warnings during conversion

Genauigkeit, Konservierung und individuelles Styling

Eines der Hauptanliegen beim Konvertieren von Dokumenten ist die Wahrung der Originaltreue. Die Dotnet-Mammoth-Bibliothek zeichnet sich in diesem Aspekt aus und ist bestrebt, die Formatierung, Stile und Struktur des Quelldokuments im resultierenden HTML so genau wie möglich beizubehalten. Die Bibliothek bietet die Möglichkeit, während des Konvertierungsprozesses benutzerdefinierte Stile anzuwenden, um sicherzustellen, dass der resultierende HTML-Code mit den Designstandards Ihrer Anwendung übereinstimmt. Dieser Grad der Anpassung verbessert die Konsistenz Ihrer Inhalte auf verschiedenen Plattformen.

 Deutsch