1. Produkte
  2.   HTML
  3.   .NET
  4.   Html Agility Pack (HAP)
 
  

Kostenlose C# .NET API zum Parsen von HTML-Dokumenten

Open Source C# .NET-Bibliothek, die Softwareentwicklern ermöglicht, HTML-Dokumente zu parsen, HTML-Elemente zu manipulieren und relevante Daten zu extrahieren

HTML-Parsing, Web-Scraping und Datenextraktion können herausfordernde und wesentliche Aufgaben für Web- und Software-Ingenieure sein. Dank der Html Agility Pack (HAP) Bibliothek können Web-Ingenieure jedoch aufatmen. Html Agility Pack (HAP) ist eine sehr leistungsstarke Open-Source-Bibliothek, die den Prozess des Parsens, Manipulierens und Abfragens von HTML-Dokumenten vereinfacht und sie zu einem unverzichtbaren Werkzeug für Webentwickler und Datenenthusiasten macht.

Das Html Agility Pack ist eine Open-Source-Bibliothek für .NET, die Entwicklern das einfache Parsen von HTML-Dokumenten ermöglicht. Es bietet ein praktisches Objektmodell und eine robuste API, um HTML-Elemente programmgesteuert zu navigieren und zu manipulieren. Egal, ob Sie Daten von Websites extrahieren, Informationen scrapen oder eine andere HTML-bezogene Aufgabe durchführen müssen, HAP kommt mit seiner intuitiven Benutzeroberfläche und umfangreichen Funktionalität zur Hilfe. Die HAP-Bibliothek kann einfach in Ihre .NET-Anwendungen mit NuGet integriert werden. Installieren Sie einfach das Paket und beginnen Sie, seine Funktionen in Ihrem Code zu verwenden.

Mit der Html Agility Pack (HAP) Bibliothek können Softwareentwickler mit HTML-Elementen über ein einfaches und intuitives Objektmodell interagieren. Elemente können leicht ausgewählt, modifiziert und abgefragt werden, wobei eine vertraute Syntax verwendet wird, was das Navigieren und Manipulieren von HTML-Dokumenten programmgesteuert zum Kinderspiel macht. Die Bibliothek ist ein Wendepunkt für Entwickler, die mit HTML-Parsing- und Manipulationsaufgaben arbeiten. Durch die Vereinfachung der Komplexität bei der Arbeit mit HTML-Dokumenten ermöglicht HAP Softwareentwicklern, sich auf das Extrahieren bedeutungsvoller Daten und den Aufbau robuster Anwendungen zu konzentrieren.

Previous Next

Einstieg in das Html Agility Pack

Die empfohlene Methode zur Installation von Html Agility Pack (HAP) ist die Verwendung von NuGet. Bitte verwenden Sie den folgenden Befehl für eine reibungslose Installation.

Html Agility Pack über NuGet installieren

NuGet\Install-Package HtmlAgilityPack -Version 1.11.46 

Sie können es auch manuell installieren; laden Sie die neuesten Release-Dateien direkt aus dem GitHub Repository herunter.

Robuste HTML-Analyse über die C#-API

Die Open-Source-Bibliothek Html Agility Pack (HAP) enthält sehr nützliche Funktionen zum Laden und Parsen von HTML in C#-Anwendungen. Die HAP-Bibliothek ist darauf ausgelegt, fehlerhaftes HTML zu verarbeiten und kann selbst die komplexesten HTML-Dokumente parsen. Sie führt eine automatische Tag-Balancierung durch, unterstützt selbstschließende Tags und passt sich an Tag-Suppe-Situationen an. Es gibt verschiedene Möglichkeiten, HTML zu laden und zu parsen, z. B. aus Dateien, Strings, dem Web und aus dem Browser. Der folgende Code zeigt verschiedene Möglichkeiten zum Laden und Parsen von Dateien in .NET-Anwendungen.

Wie man Dateien in .NET-Anwendungen über die C#-Bibliothek lädt und analysiert?

// From File
var doc = new HtmlDocument();
doc.Load(filePath);

// From String
var doc = new HtmlDocument();
doc.LoadHtml(html);

// From Web
var url = "http://html-agility-pack.net/";
var web = new HtmlWeb();
var doc = web.Load(url);

HTML-Dokumente über die C#-API manipulieren

Die kostenlose Html Agility Pack (HAP) Bibliothek enthält sehr leistungsstarke Funktionen zum Arbeiten mit HTML-Dokumenten und -Elementen in C#-Anwendungen. Das HAP ermöglicht es Ihnen, die HTML-Struktur zu ändern, indem Sie Elemente hinzufügen, ändern oder entfernen. Es gibt mehrere wichtige Funktionen, die Teil der Bibliothek sind, wie das Erstellen eines Duplikats des Knotens, das sofortige Einfügen des angegebenen Knotens, das Entfernen aller Kinder, das Hinzufügen des angegebenen Knotens ans Ende der Liste, das Erstellen eines HTML-Knotens aus einem String, der HTML darstellt, und vieles mehr. Sie können Attribute aktualisieren, den Textinhalt ändern oder sogar Elemente gemäß Ihren Anforderungen klonen. Das folgende Beispiel zeigt, wie man HTML-Dokumente mit C#-Code manipuliert.

HTML-Dokumente über die .NET-API laden und manipulieren

var doc = new HtmlDocument();
doc.LoadHtml(html);

// InnerHtml 
var innerHtml = doc.DocumentNode.InnerHtml;

// InnerText 
var innerText = doc.DocumentNode.InnerText;

 Deutsch