1. produkty
  2.   Zpracování textu
  3.   .NET
  4.   Dotnet-Mammoth
 
  

C# .NET библиотека за Създаване на документи за текстообработка

C# .NET API с отворен код позволява на разработчиците на софтуер да зареждат и конвертират документи на Microsoft Word, Google Docs и LibreOffice в HTML безплатно.

Какво е Dotnet-Mammoth?

В съвременния свят на обмен на информация способността за безпроблемно конвертиране на документи от един формат в друг стана първостепенна. Независимо дали става въпрос за архивиране, споделяне или дори само за поддържане на целостта на данните, наличието на надежден инструмент за конвертиране на документи може да направи всичко различно. Това е мястото, където библиотеката Dotnet-Mammoth влиза в действие, предлагайки мощно и гъвкаво решение за конвертиране на документи с лекота. Чрез използването на библиотеката потребителите могат да конвертират исторически документи или важни записи в достъпни и търсещи HTML файлове.

Библиотеката Dotnet-Mammot е .NET обвивка около популярната JavaScript библиотека mammoth.js. Основната му цел е да опрости процеса на конвертиране на сложни документи, предимно DOCX и DOC файлове, в HTML, позволявайки плавен преход между различни формати. Това може да бъде особено удобно, когато работите с документи в приложения, където HTML е предпочитаната среда, като например уеб приложения или системи за управление на съдържание. Поддържа функции като заглавия, списъци, адаптивна поддръжка за картографиране, форматиране на таблицата, бележки под линия и бележки в края, изображения, връзки, нови редове, текстови полета, коментари, удебелен/курсив/подчертан, зачертани и много други.

Библиотеката Dotnet-Mammoth се оказва ценен актив за разработчиците на софтуер, които изискват стабилни и точни възможности за конвертиране на документи в своите .NET приложения. Той лесно импортира и публикува документи на Word в уебсайтове или блогове, като същевременно запазва тяхното форматиране. Неговата поддръжка за сложен стил, лекота на използване и възможност за конфигуриране го отличава като предпочитан избор за работа с трансформации на документи. Използвайки силата на библиотеката, разработчиците могат да отключат свят от възможности за безпроблемно конвертиране на сложни документи, като същевременно поддържат тяхната визуална и структурна цялост.

Previous Next

Първи стъпки с Dotnet-Mammoth

Препоръчителният начин за инсталиране на Dotnet-Mammoth е използването на NuGet. Моля, използвайте следната команда за гладка инсталация.

Инсталирайте Dotnet-Mammoth от NuGet

 Install-Package Mammoth
Можете също да го изтеглите директно от GitHub.

Конвертиране на документи на Word в HTML чрез C#

Библиотеката Dotnet-Mammoth с отворен код дава на разработчиците на софтуер силата да зареждат и конвертират DOCX документи на Microsoft Word в чист и точен HTML в .NET приложения. Библиотеката превъзхожда обработката на документи на Microsoft Word (както формати .docx, така и .doc), което я прави идеален избор за приложения, които работят с широк набор от документация. Може да се похвали със забележителна точност при конвертиране на документи. Той щателно превежда не само текстовото съдържание, но и различни стилови елементи, като заглавия, списъци, таблици и дори вградени изображения. Следващият пример показва колко лесно разработчиците на софтуер могат да заредят и конвертират Word документ в HTML файлов формат с помощта на C# команди.

Как да конвертирате Word документ в HTML файл чрез C# API?

using DotnetMammoth;

class Program
{
    static void Main(string[] args)
    {
        var converter = new DocumentConverter();
        var result = converter.ConvertToHtml("path/to/document.docx");
        
        Console.WriteLine(result.Value);
    }
}

Извличане на текст и обработка на сложни документи

Библиотеката Dotnet-Mammoth с отворен код предоставя пълна поддръжка за обработка на сложни документи в C# приложения. Някои документи могат да бъдат невероятно сложни, със сложно форматиране, таблици, изображения и др. Библиотеката се справя ефективно с тази сложност, като гарантира, че дори документи със сложни оформления се конвертират с прецизност. Също така е много лесно да извлечете необработения текст на документа с помощта на ExtractRawText. Следващият пример показва как разработчиците на софтуер могат да извличат текст от Word .docx документ в .NET приложения.

Как да извлечете необработения текст на Word документ в C# приложения?

var converter = new DocumentConverter();
var result = converter.ExtractRawText("document.docx");
var html = result.Value; // The raw text
var warnings = result.Warnings; // Any warnings during conversion

Точност, запазване и персонализиран стил

Една от основните грижи при конвертирането на документи е поддържането на верността на оригиналното съдържание. Библиотеката Dotnet-Mammoth превъзхожда в този аспект, като се стреми да запази форматирането, стиловете и структурата на изходния документ възможно най-точно в получения HTML. Библиотеката предлага опция за прилагане на персонализиран стил по време на процеса на преобразуване, като гарантира, че полученият HTML е в съответствие със стандартите за дизайн на вашето приложение. Това ниво на персонализиране подобрява последователността на вашето съдържание в различни платформи.

 Čeština