1. Produtos
  2.   Processamento de texto
  3.   .NET
  4.   Dotnet-Mammoth
 
  

Biblioteca C# .NET para criação de documentos de processamento de texto

A API C# .NET de código aberto permite que os desenvolvedores de software carreguem e convertam documentos do Microsoft Word, Google Docs e LibreOffice em HTML gratuitamente.

O que é Dotnet-Mammoth?

No mundo moderno de troca de informações, a capacidade de converter facilmente documentos de um formato para outro tornou-se fundamental. Seja para arquivar, compartilhar ou apenas manter a integridade dos dados, ter uma ferramenta confiável de conversão de documentos pode fazer toda a diferença. É aqui que entra a biblioteca Dotnet-Mammoth, oferecendo uma solução poderosa e versátil para converter documentos com facilidade. Ao usar a biblioteca, os usuários podem converter documentos históricos ou registros importantes em arquivos HTML acessíveis e pesquisáveis.

A biblioteca Dotnet-Mammot é um wrapper .NET da popular biblioteca JavaScript mammoth.js. Seu principal objetivo é simplificar o processo de conversão de documentos complexos, principalmente arquivos DOCX e DOC, para HTML, permitindo uma transição suave entre diferentes formatos. Isto pode ser especialmente útil ao lidar com documentos em aplicações onde o HTML é o meio preferido, como aplicações web ou sistemas de gerenciamento de conteúdo. Ele oferece suporte a recursos como títulos, listas, suporte a mapeamento personalizável, formatação de tabela, notas de rodapé e notas finais, imagens, links, quebras de linha, caixas de texto, comentários, negrito/itálico/sublinhado, tachado e muito mais.

A biblioteca Dotnet-Mammoth prova ser um recurso valioso para desenvolvedores de software que exigem recursos robustos e precisos de conversão de documentos em seus aplicativos .NET. Ele importa e publica facilmente documentos do Word em sites ou blogs, preservando sua formatação. Seu suporte para estilos complexos, facilidade de uso e configurabilidade o diferenciam como uma escolha ideal para lidar com transformações de documentos. Ao aproveitar o poder da biblioteca, os desenvolvedores podem desbloquear um mundo de possibilidades na conversão perfeita de documentos complexos, mantendo sua integridade visual e estrutural.

Previous Next

Introdução ao Dotnet-Mammoth

A maneira recomendada de instalar o Dotnet-Mammoth é usando o NuGet. Use o seguinte comando para uma instalação tranquila.

Instale o Dotnet-Mammoth do NuGet

 Install-Package Mammoth
Você também pode baixá-lo diretamente do GitHub.

Conversão de documentos Word para HTML via C#

A biblioteca Dotnet-Mammoth de código aberto oferece aos desenvolvedores de software o poder de carregar e converter documentos DOCX do Microsoft Word em HTML limpo e preciso dentro de aplicativos .NET. A biblioteca é excelente no manuseio de documentos do Microsoft Word (formatos .docx e .doc), tornando-a a escolha ideal para aplicativos que lidam com uma ampla variedade de documentação. Possui notável precisão na conversão de documentos. Ele traduz meticulosamente não apenas o conteúdo textual, mas também vários elementos de estilo, como títulos, listas, tabelas e até imagens incorporadas. O exemplo a seguir mostra como os desenvolvedores de software podem facilmente carregar e converter documentos do Word em formato de arquivo HTML usando comandos C#.

Como converter um documento do Word em um arquivo HTML por meio da API C#?

using DotnetMammoth;

class Program
{
    static void Main(string[] args)
    {
        var converter = new DocumentConverter();
        var result = converter.ConvertToHtml("path/to/document.docx");
        
        Console.WriteLine(result.Value);
    }
}

Extrair texto e lidar com documentos complexos

A biblioteca Dotnet-Mammoth de código aberto fornece suporte completo para lidar com documentos complexos dentro de aplicativos C#. Alguns documentos podem ser incrivelmente complexos, com formatação complexa, tabelas, imagens e muito mais. A biblioteca aborda esta complexidade de forma eficaz, garantindo que mesmo documentos com layouts complexos sejam convertidos com precisão. Também é muito fácil extrair o texto bruto do documento usando ExtractRawText. O exemplo a seguir mostra como os desenvolvedores de software podem extrair texto de um documento .docx do Word dentro de aplicativos .NET.

Como extrair o texto bruto de um documento do Word dentro de aplicativos C#?

var converter = new DocumentConverter();
var result = converter.ExtractRawText("document.docx");
var html = result.Value; // The raw text
var warnings = result.Warnings; // Any warnings during conversion

Precisão, preservação e estilo personalizado

Uma das principais preocupações ao converter documentos é manter a fidelidade do conteúdo original. A biblioteca Dotnet-Mammoth se destaca nesse aspecto, esforçando-se para preservar a formatação, os estilos e a estrutura do documento de origem com a maior precisão possível no HTML resultante. A biblioteca oferece a opção de aplicar estilos personalizados durante o processo de conversão, garantindo que o HTML resultante esteja alinhado com os padrões de design do seu aplicativo. Esse nível de personalização melhora a consistência do seu conteúdo em diferentes plataformas.

 Português