1. 产品
  2.   HTML
  3.   .NET
  4.   Html Agility Pack (HAP)
 
  

用于解析 HTML 文档的免费 C# .NET API

开源 C# .NET 库,使软件开发人员能够解析 HTML 文档、操作 HTML 元素和提取相关数据。

对于 Web 和软件工程师来说,HTML 解析、网页抓取和数据提取是一项极具挑战性且至关重要的任务。然而,有了 Html Agility Pack (HAP) 库,Web 工程师现在可以松一口气了。Html Agility Pack (HAP) 是一个非常强大的开源库,它简化了解析、操作和查询 HTML 文档的过程,使其成为 Web 开发人员和数据爱好者不可或缺的工具。

Html Agility Pack 是一个适用于 .NET 的开源库,允许开发人员轻松解析 HTML 文档。它提供了一个便捷的对象模型和一组强大的 API,可以通过编程方式导航和操作 HTML 元素。无论您需要从网站提取数据、抓取信息还是执行任何其他与 HTML 相关的任务,HAP 都能凭借其直观的界面和丰富的功能为您提供帮助。您可以使用 NuGet 将 HAP 库轻松集成到您的 .NET 应用程序中。只需安装该软件包,即可在代码中开始使用其功能。

使用 Html Agility Pack (HAP) 库,软件开发人员可以使用简单直观的对象模型与 HTML 元素进行交互。他们可以使用熟悉的语法轻松地选择、修改和查询元素,从而轻松地以编程方式导航和操作 HTML 文档。对于处理 HTML 解析和操作任务的开发人员来说,该库将带来颠覆性的改变。通过简化处理 HTML 文档的复杂性,HAP 使软件开发人员能够专注于提取有意义的数据并构建强大的应用程序。

Previous Next

Html Agility Pack 入门

推荐使用 NuGet 安装 Html Agility Pack (HAP)。请使用以下命令顺利安装。

通过 NuGet 安装 Html Agility Pack

NuGet\Install-Package HtmlAgilityPack -Version 1.11.46 

您也可以手动安装;直接从 GitHub 存储库下载最新版本的文件。

通过 C# API 实现强大的 HTML 解析

开源 HTML Agility Pack (HAP) 库包含一系列非常实用的功能,可用于在 C# 应用程序中加载和解析 HTML。HAP 库旨在处理格式错误的 HTML,甚至可以解析最复杂的 HTML 文档。它执行自动标签平衡,支持自闭合标签,并能适应标签混乱的情况。加载和解析 HTML 的方式多种多样,例如从文件、字符串、Web 以及浏览器加载。以下代码展示了在 .NET 应用程序中加载和解析文件的各种方法。

如何通过 C# 库在 .NET 应用程序内加载和解析文件?

// From File
var doc = new HtmlDocument();
doc.Load(filePath);

// From String
var doc = new HtmlDocument();
doc.LoadHtml(html);

// From Web
var url = "http://html-agility-pack.net/";
var web = new HtmlWeb();
var doc = web.Load(url);

通过 C# API 操作 HTML 文档

免费的 Html Agility Pack (HAP) 库包含非常强大的功能,可用于在 C# 应用程序中处理 HTML 文档和元素。HAP 允许您通过添加、修改或删除元素来修改 HTML 结构。该库包含几个重要功能,例如创建节点副本、立即插入指定节点、删除所有子节点、将指定节点添加到列表末尾、从表示文字 HTML 的字符串创建 HTML 节点等等。您可以根据需要更新属性、更改文本内容,甚至克隆元素。以下示例展示了如何使用 C# 代码操作 HTML 文档。

通过 .NET API 加载和操作 HTML 文档

var doc = new HtmlDocument();
doc.LoadHtml(html);

// InnerHtml 
var innerHtml = doc.DocumentNode.InnerHtml;

// InnerText 
var innerText = doc.DocumentNode.InnerText;

 中国人