واجهة برمجة التطبيقات المجانية C# .NET لتحليل مستندات HTML
مكتبة C# .NET مفتوحة المصدر التي تمكن مطوري البرمجيات من تحليل مستندات HTML، والتلاعب بعناصر HTML، واستخراج البيانات ذات الصلة
يمكن أن تكون معالجة HTML، واستخراج البيانات، والتجريف من الويب مهام صعبة وأساسية لمهندسي الويب والبرمجيات. ومع ذلك، يمكن لمهندسي الويب الآن أن يتنفسوا الصعداء بفضل مكتبة Html Agility Pack (HAP). Html Agility Pack (HAP) هي مكتبة مفتوحة المصدر قوية جدًا تبسط عملية معالجة وتعديل واستعلام مستندات HTML، مما يجعلها أداة لا غنى عنها لمطوري الويب وعشاق البيانات على حد سواء.
تعتبر مكتبة Html Agility Pack مكتبة مفتوحة المصدر لـ .NET تتيح للمطورين تحليل مستندات HTML بسهولة. توفر نموذج كائن مريح ومجموعة قوية من واجهات برمجة التطبيقات للتنقل والتلاعب بعناصر HTML برمجيًا. سواء كنت بحاجة إلى استخراج البيانات من مواقع الويب، أو جمع المعلومات، أو تنفيذ أي مهمة أخرى تتعلق بـ HTML، فإن HAP يأتي لإنقاذك بواجهته البديهية ووظائفه الواسعة. يمكن دمج مكتبة HAP بسهولة في تطبيقات .NET الخاصة بك باستخدام NuGet. ما عليك سوى تثبيت الحزمة وبدء استخدام ميزاتها في كودك.
باستخدام مكتبة Html Agility Pack (HAP)، يمكن لمطوري البرمجيات التفاعل مع عناصر HTML باستخدام نموذج كائن بسيط وبديهي. يمكن اختيار العناصر وتعديلها واستعلامها بسهولة باستخدام بناء جملة مألوف، مما يجعل من السهل التنقل والتلاعب بمستندات HTML برمجيًا. المكتبة تُعتبر نقطة تحول للمطورين الذين يعملون مع مهام تحليل وتلاعب HTML. من خلال تبسيط تعقيدات العمل مع مستندات HTML، تمكّن HAP مطوري البرمجيات من التركيز على استخراج البيانات ذات المعنى وبناء تطبيقات قوية.
البدء مع حزمة Html Agility
الطريقة الموصى بها لتثبيت Html Agility Pack (HAP) هي استخدام NuGet. يرجى استخدام الأمر التالي لتثبيت سلس.
تثبيت حزمة Html Agility عبر NuGet
NuGet\Install-Package HtmlAgilityPack -Version 1.11.46
يمكنك أيضًا تثبيته يدويًا؛ قم بتنزيل أحدث ملفات الإصدار مباشرة من مستودع GitHub.
تحليل HTML قوي عبر واجهة برمجة التطبيقات C#
تحتوي مكتبة Html Agility Pack (HAP) مفتوحة المصدر على ميزات مفيدة جدًا لتحميل وتحليل HTML داخل تطبيقات C#. تم تصميم مكتبة HAP للتعامل مع HTML غير الصحيح ويمكنها تحليل حتى أكثر مستندات HTML تعقيدًا. تقوم بتنفيذ توازن تلقائي للتاجات، وتدعم التاجات ذات الإغلاق الذاتي، وتتكيف مع حالات فوضى التاجات. هناك طرق متنوعة لتحميل وتحليل HTML، مثل من ملف، سلسلة، ويب، ومن المتصفح. يوضح الكود التالي طرقًا متنوعة لتحميل وتحليل الملفات داخل تطبيقات .NET.
كيفية تحميل وتحليل الملفات داخل تطبيقات .NET عبر مكتبة C#؟
// From File
var doc = new HtmlDocument();
doc.Load(filePath);
// From String
var doc = new HtmlDocument();
doc.LoadHtml(html);
// From Web
var url = "http://html-agility-pack.net/";
var web = new HtmlWeb();
var doc = web.Load(url);
التلاعب بمستندات HTML عبر واجهة برمجة التطبيقات C#
تتضمن مكتبة Html Agility Pack (HAP) المجانية ميزات قوية جدًا للعمل مع مستندات HTML والعناصر داخل تطبيقات C#. تتيح لك HAP تعديل هيكل HTML عن طريق إضافة أو تعديل أو إزالة العناصر. هناك العديد من الميزات المهمة التي تعد جزءًا من المكتبة، مثل إنشاء نسخة مكررة من العقدة، وإدراج العقدة المحددة على الفور، وإزالة جميع الأطفال، وإضافة العقدة المحددة إلى نهاية القائمة، وإنشاء عقدة HTML من سلسلة تمثل HTML حرفيًا والعديد من الميزات الأخرى. يمكنك تحديث السمات، وتغيير محتوى النص، أو حتى استنساخ العناصر حسب متطلباتك. يوضح المثال التالي كيفية معالجة مستندات HTML باستخدام كود C#.
تحميل ومعالجة مستندات HTML عبر واجهة برمجة التطبيقات .NET
var doc = new HtmlDocument();
doc.LoadHtml(html);
// InnerHtml
var innerHtml = doc.DocumentNode.InnerHtml;
// InnerText
var innerText = doc.DocumentNode.InnerText;