1. Produse
  2.   Procesarea cuvântului
  3.   .NET
  4.   Dotnet-Mammoth
 
  

Biblioteca C# .NET pentru crearea documentelor de procesare a textului

API-ul C# .NET cu sursă deschisă le permite dezvoltatorilor de software să încarce și să convertească gratuit documentele Microsoft Word, Google Docs și LibreOffice în HTML.

Ce este Dotnet-Mammoth?

În lumea modernă a schimbului de informații, capacitatea de a converti fără probleme documente dintr-un format în altul a devenit primordială. Fie că este vorba de arhivare, partajare sau chiar pentru menținerea integrității datelor, un instrument fiabil de conversie a documentelor poate face toată diferența. Aici intervine biblioteca Dotnet-Mammoth, oferind o soluție puternică și versatilă pentru conversia documentelor cu ușurință. Prin utilizarea bibliotecii, utilizatorii pot converti documente istorice sau înregistrări importante în fișiere HTML accesibile și care pot fi căutate.

Biblioteca Dotnet-Mammot este un înveliș .NET în jurul popularei biblioteci JavaScript mammoth.js. Scopul său principal este de a simplifica procesul de conversie a documentelor complexe, în primul rând fișierelor DOCX și DOC, în HTML, permițând o tranziție lină între diferite formate. Acest lucru poate fi deosebit de util atunci când aveți de-a face cu documente în aplicații în care HTML este mediul preferat, cum ar fi aplicațiile web sau sistemele de gestionare a conținutului. Acceptă funcții precum titluri, liste, suport de cartografiere personalizabilă, formatarea tabelului, note de subsol și note de final, imagini, linkuri, întreruperi de rând, casete de text, comentarii, aldine/cursive/subliniate, bare și multe altele.

Biblioteca Dotnet-Mammoth se dovedește a fi un atu valoros pentru dezvoltatorii de software care au nevoie de capabilități solide și precise de conversie a documentelor în aplicațiile lor .NET. Importă și publică cu ușurință documente Word pe site-uri web sau bloguri, păstrând în același timp formatarea. Suportul pentru stilul complicat, ușurința de utilizare și configurabilitatea îl deosebește ca o alegere de preferat pentru gestionarea transformărilor documentelor. Prin valorificarea puterii bibliotecii, dezvoltatorii pot debloca o lume de posibilități în conversia fără probleme a documentelor complexe, păstrând în același timp integritatea vizuală și structurală.

Previous Next

Noțiuni introductive cu Dotnet-Mammoth

Modul recomandat de a instala Dotnet-Mammoth este utilizarea NuGet. Vă rugăm să utilizați următoarea comandă pentru o instalare fără probleme.

Instalați Dotnet-Mammoth din NuGet

 Install-Package Mammoth
De asemenea, îl puteți descărca direct de pe GitHub.

Conversia documentelor Word în HTML prin C#

Biblioteca open source Dotnet-Mammoth oferă dezvoltatorilor de software puterea de a încărca și converti documente Microsoft Word DOCX în HTML curat și precis în aplicațiile .NET. Biblioteca excelează în manipularea documentelor Microsoft Word (atât în formate .docx, cât și .doc), ceea ce o face o alegere ideală pentru aplicațiile care se ocupă cu o gamă largă de documentație. Se mândrește cu o acuratețe remarcabilă în conversia documentelor. Traduce meticulos nu numai conținutul textual, ci și diverse elemente de stil, cum ar fi titluri, liste, tabele și chiar imagini încorporate. Următorul exemplu arată cât de ușor pot dezvoltatorii de software să încarce și să convertească documentul Word în format de fișier HTML folosind comenzile C#.

Cum se convertesc documentul Word în fișier HTML prin API-ul C#?

using DotnetMammoth;

class Program
{
    static void Main(string[] args)
    {
        var converter = new DocumentConverter();
        var result = converter.ConvertToHtml("path/to/document.docx");
        
        Console.WriteLine(result.Value);
    }
}

Extrage text și gestionarea documentelor complexe

Biblioteca open source Dotnet-Mammoth a oferit suport complet pentru gestionarea documentelor complexe în cadrul aplicațiilor C#. Unele documente pot fi incredibil de complicate, cu formatări complexe, tabele, imagini și multe altele. Biblioteca abordează această complexitate în mod eficient, asigurându-se că chiar și documentele cu machete complicate sunt convertite cu precizie. De asemenea, este foarte ușor să extrageți textul brut al documentului utilizând ExtractRawText. Următorul exemplu arată cum dezvoltatorii de software pot extrage text dintr-un document Word .docx în cadrul aplicațiilor .NET.

Cum să extrageți textul brut al unui document Word în aplicațiile C#?

var converter = new DocumentConverter();
var result = converter.ExtractRawText("document.docx");
var html = result.Value; // The raw text
var warnings = result.Warnings; // Any warnings during conversion

Acuratețe, conservare și stil personalizat

Una dintre preocupările principale atunci când convertiți documente este menținerea fidelității conținutului original. Biblioteca Dotnet-Mammoth excelează în acest aspect, străduindu-se să păstreze formatarea, stilurile și structura documentului sursă cât mai precis posibil în HTML rezultat. Biblioteca oferă opțiunea de a aplica un stil personalizat în timpul procesului de conversie, asigurându-se că HTML rezultat se aliniază cu standardele de design ale aplicației dvs. Acest nivel de personalizare îmbunătățește consistența conținutului dvs. pe diferite platforme.

 Română