1. Produk
  2.   HTML
  3.   .NET
  4.   Html Agility Pack (HAP)
 
  

API C# .NET Percuma untuk Mengurai Dokumen HTML

Perpustakaan C# .NET sumber terbuka yang membolehkan pemaju perisian untuk menganalisis dokumen HTML, memanipulasi elemen HTML, dan mengekstrak data yang relevan

Pemprosesan HTML, pengikisan web, dan pengambilan data boleh menjadi tugas yang mencabar dan penting bagi jurutera web dan perisian. Walau bagaimanapun, jurutera web kini boleh menarik nafas lega terima kasih kepada perpustakaan Html Agility Pack (HAP). Html Agility Pack (HAP) adalah perpustakaan sumber terbuka yang sangat kuat yang memudahkan proses pemprosesan, manipulasi, dan pertanyaan dokumen HTML, menjadikannya aset yang tidak ternilai bagi pembangun web dan peminat data.

Paket Html Agility adalah perpustakaan sumber terbuka untuk .NET yang membolehkan pemaju untuk menguraikan dokumen HTML dengan mudah. Ia menyediakan model objek yang mudah dan set API yang kukuh untuk menavigasi dan memanipulasi elemen HTML secara programatik. Sama ada anda perlu mengekstrak data dari laman web, mengikis maklumat, atau melakukan sebarang tugas berkaitan HTML yang lain, HAP datang untuk menyelamatkan dengan antara muka yang intuitif dan fungsi yang luas. Perpustakaan HAP boleh dengan mudah diintegrasikan ke dalam aplikasi .NET anda menggunakan NuGet. Cukup pasang pakej dan mula menggunakan ciri-cirinya dalam kod anda.

Dengan menggunakan perpustakaan Html Agility Pack (HAP), pemaju perisian dapat berinteraksi dengan elemen HTML menggunakan model objek yang mudah dan intuitif. Elemen boleh dipilih, diubah suai, dan ditanya dengan mudah menggunakan sintaks yang biasa, menjadikannya mudah untuk menavigasi dan memanipulasi dokumen HTML secara programatik. Perpustakaan ini adalah pengubah permainan bagi pemaju yang bekerja dengan tugas penguraian dan manipulasi HTML. Dengan menyederhanakan kerumitan bekerja dengan dokumen HTML, HAP memberdayakan pemaju perisian untuk fokus pada mengekstrak data yang bermakna dan membina aplikasi yang kukuh.

Previous Next

Memulakan dengan Html Agility Pack

Kaedah yang disyorkan untuk memasang Html Agility Pack (HAP) adalah menggunakan NuGet. Sila gunakan arahan berikut untuk pemasangan yang lancar.

Pasang Html Agility Pack melalui NuGet

NuGet\Pasang-Pakej HtmlAgilityPack -Versi 1.11.46 

Anda juga boleh memasangnya secara manual; muat turun fail keluaran terkini terus dari repositori GitHub.

Penyahkodan HTML yang Kukuh melalui API C#

Pustaka Html Agility Pack (HAP) sumber terbuka telah menyertakan ciri yang sangat berguna untuk memuat dan menganalisis HTML dalam aplikasi C#. Pustaka HAP direka untuk menangani HTML yang tidak betul dan boleh menganalisis dokumen HTML yang paling kompleks sekalipun. Ia melakukan pengimbangan tag secara automatik, menyokong tag penutup sendiri, dan menyesuaikan dengan situasi tag soup. Terdapat pelbagai cara untuk memuat dan menganalisis HTML, seperti dari fail, rentetan, web, dan dari Penyemak Imbas. Kod berikut menunjukkan pelbagai cara untuk memuat dan menganalisis fail dalam aplikasi .NET.

Bagaimana untuk Memuat dan Mengurai fail dalam aplikasi .NET melalui Perpustakaan C#?

// From File
var doc = new HtmlDocument();
doc.Load(filePath);

// From String
var doc = new HtmlDocument();
doc.LoadHtml(html);

// From Web
var url = "http://html-agility-pack.net/";
var web = new HtmlWeb();
var doc = web.Load(url);

Manipulasi Dokumen HTML melalui API C#

Perpustakaan Html Agility Pack (HAP) percuma telah menyertakan ciri-ciri yang sangat berkuasa untuk bekerja dengan dokumen dan elemen HTML dalam aplikasi C#. HAP membolehkan anda mengubah struktur HTML dengan menambah, mengubah, atau menghapus elemen. Terdapat beberapa ciri penting yang merupakan sebahagian daripada perpustakaan ini, seperti mencipta salinan nod, menyisipkan nod yang ditentukan dengan segera, menghapus semua anak, menambah nod yang ditentukan ke akhir senarai, mencipta nod HTML dari string yang mewakili HTML literal dan banyak lagi. Anda boleh mengemas kini atribut, mengubah kandungan teks, atau bahkan mengklon elemen mengikut keperluan anda. Contoh berikut menunjukkan cara memanipulasi dokumen HTML menggunakan kod C#.

Memuat dan Memanipulasi Dokumen HTML melalui API .NET

var doc = new HtmlDocument();
doc.LoadHtml(html);

// InnerHtml 
var innerHtml = doc.DocumentNode.InnerHtml;

// InnerText 
var innerText = doc.DocumentNode.InnerText;

 Melayu