1. Ürün:% s
  2.   HTML
  3.   .NET
  4.   Html Agility Pack (HAP)
 
  

HTML Belgelerini Ayrıştırmak İçin Ücretsiz C# .NET API'si

Yazılım geliştiricilerin HTML belgelerini ayrıştırmasına, HTML öğelerini düzenlemesine ve ilgili verileri çıkarmasına olanak tanıyan Açık Kaynaklı C# .NET kitaplığı

HTML ayrıştırma, web kazıma ve veri çıkarma, web ve yazılım mühendisleri için zorlu ve önemli görevler olabilir. Ancak web mühendisleri artık Html Agility Pack (HAP) kütüphanesi sayesinde rahat bir nefes alabilir. Html Agility Pack (HAP), HTML belgelerini ayrıştırma, düzenleme ve sorgulama sürecini basitleştiren, hem web geliştiricileri hem de veri meraklıları için vazgeçilmez bir kaynak haline getiren çok güçlü bir açık kaynaklı kütüphanedir.

Html Agility Pack, geliştiricilerin HTML belgelerini kolayca ayrıştırmasına olanak tanıyan açık kaynaklı bir .NET kütüphanesidir. HTML öğelerinde programatik olarak gezinmek ve bunları işlemek için kullanışlı bir nesne modeli ve güçlü bir API seti sunar. İster web sitelerinden veri ayıklamanız, ister bilgi toplamanız veya HTML ile ilgili başka bir görev gerçekleştirmeniz gereksin, HAP sezgisel arayüzü ve kapsamlı işlevselliğiyle imdadınıza yetişir. HAP kütüphanesi, NuGet kullanarak .NET uygulamalarınıza kolayca entegre edilebilir. Paketi kurun ve özelliklerini kodunuzda kullanmaya başlayın.

Html Agility Pack (HAP) kütüphanesini kullanan yazılım geliştiriciler, basit ve sezgisel bir nesne modeli kullanarak HTML öğeleriyle etkileşim kurabilirler. Öğeler, tanıdık sözdizimi kullanılarak kolayca seçilebilir, değiştirilebilir ve sorgulanabilir; bu da HTML belgelerinde programatik olarak gezinmeyi ve düzenlemeyi kolaylaştırır. Kütüphane, HTML ayrıştırma ve düzenleme görevleriyle çalışan geliştiriciler için çığır açıcıdır. HAP, HTML belgeleriyle çalışmanın karmaşıklıklarını basitleştirerek yazılım geliştiricilerin anlamlı veriler çıkarmaya ve sağlam uygulamalar oluşturmaya odaklanmalarını sağlar.

Previous Next

Html Agility Pack'e Başlarken

Html Agility Pack'i (HAP) kurmanın önerilen yolu NuGet kullanmaktır. Sorunsuz bir kurulum için lütfen aşağıdaki komutu kullanın.

Html Agility Pack'i NuGet aracılığıyla yükleyin

NuGet\Install-Package HtmlAgilityPack -Version 1.11.46 

Ayrıca manuel olarak da kurabilirsiniz; en son sürüm dosyalarını doğrudan GitHub deposundan indirin.

C# API ile Güçlü HTML Ayrıştırma

Açık kaynaklı HTML Agility Pack (HAP) kütüphanesi, C# uygulamaları içinde HTML ayrıştırmayı yüklemek ve ayrıştırmak için oldukça kullanışlı özellikler içerir. HAP kütüphanesi, hatalı biçimlendirilmiş HTML'yi işlemek üzere tasarlanmıştır ve en karmaşık HTML belgelerini bile ayrıştırabilir. Otomatik etiket dengelemesi gerçekleştirir, kendi kendine kapanan etiketleri destekler ve etiket karmaşası durumlarına uyum sağlar. HTML'yi dosyadan, dizeden, web'den ve tarayıcıdan yüklemek ve ayrıştırmak için çeşitli yollar vardır. Aşağıdaki kod, .NET uygulamaları içinde dosyaları yüklemek ve ayrıştırmak için çeşitli yollar göstermektedir.

C# Kütüphanesi ile .NET uygulamalarının içindeki dosyalar nasıl yüklenir ve ayrıştırılır?

// From File
var doc = new HtmlDocument();
doc.Load(filePath);

// From String
var doc = new HtmlDocument();
doc.LoadHtml(html);

// From Web
var url = "http://html-agility-pack.net/";
var web = new HtmlWeb();
var doc = web.Load(url);

C# API ile HTML Belgelerini İşleyin

Ücretsiz HTML Agility Pack (HAP) kütüphanesi, C# uygulamaları içindeki HTML belgeleri ve öğeleriyle çalışmak için çok güçlü özellikler içerir. HAP, öğeler ekleyerek, değiştirerek veya kaldırarak HTML yapısını düzenlemenize olanak tanır. Kütüphanenin bir parçası olarak, düğümün bir kopyasını oluşturma, belirtilen düğümü hemen ekleme, tüm alt düğümleri kaldırma, belirtilen düğümü listenin sonuna ekleme, gerçek HTML'yi temsil eden bir dizeden bir HTML düğümü oluşturma ve daha birçok önemli özellik bulunur. Nitelikleri güncelleyebilir, metin içeriğini değiştirebilir ve hatta öğeleri gereksinimlerinize göre klonlayabilirsiniz. Aşağıdaki örnek, HTML belgelerinin C# kodu kullanılarak nasıl işlendiğini göstermektedir.

.NET API aracılığıyla HTML Belgelerini Yükleme ve Düzenleme

var doc = new HtmlDocument();
doc.LoadHtml(html);

// InnerHtml 
var innerHtml = doc.DocumentNode.InnerHtml;

// InnerText 
var innerText = doc.DocumentNode.InnerText;

 Türkçe