مكتبة C# .NET لإنشاء مستندات معالجة النصوص

يتيح C# .NET API مفتوح المصدر لمطوري البرامج إمكانية تحميل وتحويل مستندات Microsoft Word وGoogle Docs وLibreOffice إلى HTML مجانًا.

ما هو الدوت نت ماموث؟

في عالم تبادل المعلومات الحديث، أصبحت القدرة على تحويل المستندات بسلاسة من تنسيق إلى آخر أمرًا بالغ الأهمية. سواء كان الأمر يتعلق بالأرشفة أو المشاركة أو حتى الحفاظ على سلامة البيانات، فإن وجود أداة موثوقة لتحويل المستندات يمكن أن يحدث فرقًا كبيرًا. وهنا يأتي دور مكتبة Dotnet-Mammoth، حيث تقدم حلاً قويًا ومتعدد الاستخدامات لتحويل المستندات بسهولة. وباستخدام المكتبة، يمكن للمستخدمين تحويل المستندات التاريخية أو السجلات المهمة إلى ملفات HTML يمكن الوصول إليها والبحث فيها.

مكتبة Dotnet-Mammot عبارة عن غلاف .NET حول مكتبة mammoth.js JavaScript الشهيرة. والغرض الرئيسي منه هو تبسيط عملية تحويل المستندات المعقدة، وخاصة ملفات DOCX وDOC، إلى HTML، مما يسمح بالانتقال السلس بين التنسيقات المختلفة. يمكن أن يكون هذا مفيدًا بشكل خاص عند التعامل مع المستندات في التطبيقات التي يكون فيها HTML هو الوسيط المفضل، مثل تطبيقات الويب أو أنظمة إدارة المحتوى. وهو يدعم ميزات مثل العناوين، والقوائم، ودعم الخرائط القابلة للتخصيص، وتنسيق الجدول، والحواشي السفلية والتعليقات الختامية، والصور، والروابط، وفواصل الأسطر، ومربعات النص، والتعليقات، والخط الغامق/المائل/تسطير، ويتوسطه خط، وغير ذلك الكثير.

تثبت مكتبة Dotnet-Mammoth أنها أحد الأصول القيمة لمطوري البرامج الذين يحتاجون إلى إمكانات قوية ودقيقة لتحويل المستندات داخل تطبيقات .NET الخاصة بهم. يقوم بسهولة باستيراد مستندات Word ونشرها على مواقع الويب أو المدونات مع الحفاظ على تنسيقها. إن دعمه للتصميم المعقد وسهولة الاستخدام وقابلية التكوين يميزه كخيار مفضل للتعامل مع تحويلات المستندات. ومن خلال الاستفادة من قوة المكتبة، يمكن للمطورين إطلاق العنان لعالم من الإمكانيات في تحويل المستندات المعقدة بسلاسة مع الحفاظ على سلامتها البصرية والهيكلية.

Previous Next

البدء مع Dotnet-Mammoth

الطريقة الموصى بها لتثبيت Dotnet-Mammoth هي استخدام NuGet. الرجاء استخدام الأمر التالي للتثبيت السلس.

قم بتثبيت Dotnet-Mammoth من NuGet

 Install-Package Mammoth
يمكنك أيضًا تنزيله مباشرةً من GitHub.

تحويل مستندات Word إلى HTML عبر C#

توفر مكتبة Dotnet-Mammoth مفتوحة المصدر لمطوري البرامج القدرة على تحميل وتحويل مستندات Microsoft Word DOCX إلى HTML نظيف ودقيق داخل تطبيقات .NET. تتفوق المكتبة في التعامل مع مستندات Microsoft Word (بتنسيقي .docx و.doc)، مما يجعلها خيارًا مثاليًا للتطبيقات التي تتعامل مع مجموعة واسعة من الوثائق. يتميز بدقة ملحوظة في تحويل المستندات. فهو لا يترجم بدقة المحتوى النصي فحسب، بل يترجم أيضًا عناصر التصميم المختلفة، مثل العناوين والقوائم والجداول وحتى الصور المضمنة. يوضح المثال التالي مدى سهولة قيام مطوري البرامج بتحميل مستند Word وتحويله إلى تنسيق ملف HTML باستخدام أوامر C#.

كيفية تحويل مستند Word إلى ملف HTML عبر C# API؟

using DotnetMammoth;

class Program
{
    static void Main(string[] args)
    {
        var converter = new DocumentConverter();
        var result = converter.ConvertToHtml("path/to/document.docx");
        
        Console.WriteLine(result.Value);
    }
}

استخراج النصوص ومعالجة المستندات المعقدة

توفر مكتبة Dotnet-Mammoth مفتوحة المصدر دعمًا كاملاً للتعامل مع المستندات المعقدة داخل تطبيقات C#. يمكن أن تكون بعض المستندات معقدة بشكل لا يصدق، حيث تحتوي على تنسيقات وجداول وصور معقدة وغير ذلك الكثير. تتعامل المكتبة مع هذا التعقيد بشكل فعال، مما يضمن تحويل المستندات ذات التخطيطات المعقدة بدقة. من السهل أيضًا استخراج النص الأولي للمستند باستخدام ExtractRawText. يوضح المثال التالي كيف يمكن لمطوري البرامج استخراج النص من مستند Word .docx داخل تطبيقات .NET.

كيفية استخراج النص الخام من مستند Word داخل تطبيقات C#؟

var converter = new DocumentConverter();
var result = converter.ExtractRawText("document.docx");
var html = result.Value; // The raw text
var warnings = result.Warnings; // Any warnings during conversion

الدقة والحفظ والتصميم المخصص

أحد الاهتمامات الأساسية عند تحويل المستندات هو الحفاظ على دقة المحتوى الأصلي. تتفوق مكتبة Dotnet-Mammoth في هذا الجانب، وتسعى جاهدة للحفاظ على تنسيق وأنماط وبنية المستند المصدر بأكبر قدر ممكن من الدقة في HTML الناتج. توفر المكتبة خيار تطبيق التصميم المخصص أثناء عملية التحويل، مما يضمن توافق HTML الناتج مع معايير التصميم الخاصة بالتطبيق الخاص بك. يعمل هذا المستوى من التخصيص على تحسين اتساق المحتوى الخاص بك عبر الأنظمة الأساسية المختلفة.

 عربي