1. สินค้า
  2.   HTML
  3.   .NET
  4.   Html Agility Pack (HAP)
 
  

API C# .NET ฟรีสำหรับการแยกวิเคราะห์เอกสาร HTML

ไลบรารี C# .NET โอเพ่นซอร์สที่ช่วยให้นักพัฒนาซอฟต์แวร์สามารถวิเคราะห์เอกสาร HTML จัดการองค์ประกอบ HTML และดึงข้อมูลที่เกี่ยวข้อง

การแยกวิเคราะห์ HTML, การสแกนเว็บ และการดึงข้อมูล อาจเป็นงานที่ท้าทายและจำเป็นสำหรับวิศวกรเว็บและซอฟต์แวร์ อย่างไรก็ตาม วิศวกรเว็บสามารถโล่งใจได้แล้วด้วยไลบรารี Html Agility Pack (HAP) Html Agility Pack (HAP) เป็นไลบรารีโอเพนซอร์สที่ทรงพลังมาก ซึ่งช่วยลดความยุ่งยากของกระบวนการแยกวิเคราะห์ จัดการ และสืบค้นเอกสาร HTML ทำให้เป็นทรัพยากรที่ขาดไม่ได้สำหรับนักพัฒนาเว็บและผู้ที่ชื่นชอบข้อมูล

Html Agility Pack เป็นไลบรารีโอเพนซอร์สสำหรับ .NET ที่ช่วยให้นักพัฒนาสามารถแยกวิเคราะห์เอกสาร HTML ได้อย่างง่ายดาย มีโมเดลวัตถุที่ใช้งานง่ายและชุด API ที่แข็งแกร่งสำหรับการนำทางและจัดการองค์ประกอบ HTML ผ่านโปรแกรม ไม่ว่าคุณจะต้องการดึงข้อมูลจากเว็บไซต์ สแกนข้อมูล หรือทำงานอื่นๆ ที่เกี่ยวข้องกับ HTML HAP ก็พร้อมช่วยเหลือคุณด้วยอินเทอร์เฟซที่ใช้งานง่ายและฟังก์ชันการทำงานที่ครอบคลุม ไลบรารี HAP สามารถผสานรวมเข้ากับแอปพลิเคชัน .NET ของคุณได้อย่างง่ายดายโดยใช้ NuGet เพียงติดตั้งแพ็กเกจและเริ่มใช้งานฟีเจอร์ต่างๆ ในโค้ดของคุณ

ด้วยการใช้ไลบรารี Html Agility Pack (HAP) นักพัฒนาซอฟต์แวร์สามารถโต้ตอบกับองค์ประกอบ HTML โดยใช้โมเดลวัตถุที่เรียบง่ายและใช้งานง่าย สามารถเลือก แก้ไข และสืบค้นองค์ประกอบต่างๆ ได้อย่างง่ายดายด้วยไวยากรณ์ที่คุ้นเคย ทำให้การนำทางและจัดการเอกสาร HTML ผ่านโปรแกรมเป็นเรื่องง่าย ไลบรารีนี้ถือเป็นตัวเปลี่ยนเกมสำหรับนักพัฒนาที่ทำงานเกี่ยวกับงานการแยกวิเคราะห์และจัดการ HTML ด้วยการทำให้ความซับซ้อนในการทำงานกับเอกสาร HTML ง่ายขึ้น HAP ช่วยให้นักพัฒนาซอฟต์แวร์สามารถมุ่งเน้นไปที่การดึงข้อมูลที่มีความหมายและสร้างแอปพลิเคชันที่มีประสิทธิภาพ

Previous Next

การเริ่มต้นใช้งาน Html Agility Pack

วิธีที่แนะนำในการติดตั้ง Html Agility Pack (HAP) คือการใช้ NuGet โปรดใช้คำสั่งต่อไปนี้เพื่อการติดตั้งที่ราบรื่น

ติดตั้ง Html Agility Pack ผ่าน NuGet
NuGet\Install-Package HtmlAgilityPack -Version 1.11.46 

คุณสามารถติดตั้งด้วยตนเองได้ ดาวน์โหลดไฟล์รุ่นล่าสุดโดยตรงจากที่เก็บ GitHub

การแยกวิเคราะห์ HTML ที่มีประสิทธิภาพผ่าน C# API

ไลบรารี Html Agility Pack (HAP) แบบโอเพนซอร์สได้รวมเอาฟีเจอร์ที่มีประโยชน์มากมายสำหรับการโหลดและแยกวิเคราะห์ HTML ภายในแอปพลิเคชัน C# ไลบรารี HAP ออกแบบมาเพื่อจัดการกับ HTML ที่มีรูปแบบไม่ถูกต้องและสามารถแยกวิเคราะห์ได้แม้กระทั่งเอกสาร HTML ที่ซับซ้อนที่สุด ไลบรารีนี้จะทำการปรับสมดุลแท็กอัตโนมัติ รองรับแท็กที่ปิดเองได้ และปรับให้เข้ากับสถานการณ์แท็กซุป มีหลายวิธีในการโหลดและแยกวิเคราะห์ HTML เช่น จากไฟล์ สตริง เว็บ และจากเบราว์เซอร์ โค้ดต่อไปนี้แสดงวิธีต่างๆ สำหรับการโหลดและแยกวิเคราะห์ไฟล์ภายในแอปพลิเคชัน .NET

วิธีการโหลดและแยกไฟล์ภายในแอปพลิเคชัน .NET ผ่านทางไลบรารี C#
// From File
var doc = new HtmlDocument();
doc.Load(filePath);

// From String
var doc = new HtmlDocument();
doc.LoadHtml(html);

// From Web
var url = "http://html-agility-pack.net/";
var web = new HtmlWeb();
var doc = web.Load(url);

จัดการเอกสาร HTML ผ่าน C# API

ไลบรารี Html Agility Pack (HAP) ฟรีนี้ประกอบด้วยฟีเจอร์อันทรงพลังมากมายสำหรับการทำงานกับเอกสารและองค์ประกอบ HTML ภายในแอปพลิเคชัน C# HAP ช่วยให้คุณสามารถปรับเปลี่ยนโครงสร้าง HTML ได้โดยการเพิ่ม แก้ไข หรือลบองค์ประกอบ ไลบรารีนี้มีคุณสมบัติสำคัญหลายประการ เช่น การสร้างโหนดซ้ำ การแทรกโหนดที่ระบุทันที การลบโหนดย่อยทั้งหมด การเพิ่มโหนดที่ระบุไปยังท้ายรายการ การสร้างโหนด HTML จากสตริงที่แทนค่า HTML แบบลิเทอรัล และอื่นๆ อีกมากมาย คุณสามารถอัปเดตแอตทริบิวต์ เปลี่ยนแปลงเนื้อหาข้อความ หรือแม้แต่โคลนองค์ประกอบตามความต้องการของคุณ ตัวอย่างต่อไปนี้แสดงวิธีการจัดการเอกสาร HTML โดยใช้โค้ด C#

โหลดและจัดการเอกสาร HTML ผ่าน .NET API

var doc = new HtmlDocument();
doc.LoadHtml(html);

// InnerHtml 
var innerHtml = doc.DocumentNode.InnerHtml;

// InnerText 
var innerText = doc.DocumentNode.InnerText;

 ไทย