1. מוצרים
  2.   HTML
  3.   .NET
  4.   Html Agility Pack (HAP)
 
  

API חינם ב-C# .NET לניתוח מסמכי HTML

ספריית קוד פתוח C# .NET המאפשרת למפתחים לפרש מסמכי HTML, למניפולציה של אלמנטים ב-HTML, ולהפיק נתונים רלוונטיים

ניתוח HTML, גריסת אתרים, וחילוץ נתונים יכולים להיות משימות מאתגרות וחיוניות עבור מהנדסי אינטרנט ותוכנה. עם זאת, מהנדסי אינטרנט יכולים כעת לנשום לרווחה בזכות ספריית Html Agility Pack (HAP). Html Agility Pack (HAP) היא ספרייה מאוד עוצמתית בקוד פתוח שמפשטת את תהליך הניתוח, המניפולציה, והשאילתות של מסמכי HTML, מה שהופך אותה לנכס שאין לו תחליף עבור מפתחי אתרים וחובבי נתונים כאחד.

חבילת Html Agility היא ספריית קוד פתוח עבור .NET המאפשרת למפתחים לנתח מסמכי HTML בקלות. היא מספקת מודל אובייקטים נוח ומערך חזק של APIs כדי לנווט ול-manipulate אלמנטים של HTML בצורה תכנותית. בין אם אתה צריך לחלץ נתונים מאתרי אינטרנט, לגרד מידע, או לבצע כל משימה אחרת הקשורה ל-HTML, HAP מגיעה לעזרה עם הממשק האינטואיטיבי שלה ופונקציות רחבות. ניתן לשלב את ספריית HAP בקלות בתוך היישומים שלך ב-.NET באמצעות NuGet. פשוט התקן את החבילה והתחל להשתמש בתכונות שלה בקוד שלך.

באמצעות ספריית Html Agility Pack (HAP), מפתחים יכולים לקיים אינטראקציה עם אלמנטים של HTML באמצעות מודל אובייקטים פשוט ואינטואיטיבי. אלמנטים יכולים להיות נבחרים, מותאמים ונשאלים בקלות באמצעות תחביר מוכר, מה שהופך את הניווט וה-manipulation של מסמכי HTML לתהליך קל. הספרייה היא שינוי משחק עבור מפתחים שעובדים עם משימות של ניתוח ו-manipulation של HTML. על ידי פישוט המורכבויות של עבודה עם מסמכי HTML, HAP מעניקה למפתחים את הכוח להתמקד בהפקת נתונים משמעותיים ובבניית יישומים חזקים.

Previous Next

התחלת עבודה עם Html Agility Pack

הדרך המומלצת להתקין את Html Agility Pack (HAP) היא באמצעות NuGet. אנא השתמש בפקודה הבאה להתקנה חלקה.

התקן את Html Agility Pack באמצעות NuGet

NuGet\Install-Package HtmlAgilityPack -Version 1.11.46 

אתה יכול גם להתקין אותו ידנית; הורד את קבצי הגרסה האחרונה ישירות מ- GitHub מאגר.

ניתוח HTML חזק באמצעות API של C#

ספריית Html Agility Pack (HAP) בקוד פתוח כוללת תכונות מאוד שימושיות לטעינה וניתוח HTML בתוך יישומי C#. ספריית HAP מיועדת להתמודד עם HTML לא תקין ויכולה לנתח אפילו את המסמכים המורכבים ביותר ב-HTML. היא מבצעת איזון אוטומטי של תגיות, תומכת בתגיות סגירה עצמית, ומסתגלת למצבים של מרק תגיות. ישנן דרכים שונות לטעון ולנתח HTML, כגון מקובץ, משרשור, מהאינטרנט, ומדפדפן. הקוד הבא מציג דרכים שונות לטעינה וניתוח קבצים בתוך יישומי .NET.

איך לטעון ולנתח קבצים בתוך יישומי .NET באמצעות ספריית C#?

// From File
var doc = new HtmlDocument();
doc.Load(filePath);

// From String
var doc = new HtmlDocument();
doc.LoadHtml(html);

// From Web
var url = "http://html-agility-pack.net/";
var web = new HtmlWeb();
var doc = web.Load(url);

לשנות מסמכי HTML באמצעות API של C#

ספריית Html Agility Pack (HAP) החינמית כוללת תכונות מאוד חזקות לעבודה עם מסמכי HTML ואלמנטים בתוך יישומי C#. ה-HAP מאפשרת לך לשנות את מבנה ה-HTML על ידי הוספה, שינוי או הסרה של אלמנטים. ישנן מספר תכונות חשובות כחלק מהספרייה, כגון יצירת עותק של הצומת, הכנסת הצומת המוגדר מיד, הסרת כל הילדים, הוספת הצומת המוגדר לסוף הרשימה, יצירת צומת HTML ממחרוזת המייצגת HTML ליטרלי ועוד רבים. אתה יכול לעדכן מאפיינים, לשנות תוכן טקסטואלי, או אפילו לשכפל אלמנטים לפי הצרכים שלך. הדוגמה הבאה מראה כיצד למניפולציה במסמכי HTML באמצעות קוד C#.

טען ומניפולציה של מסמכי HTML באמצעות API של .NET

var doc = new HtmlDocument();
doc.LoadHtml(html);

// InnerHtml 
var innerHtml = doc.DocumentNode.InnerHtml;

// InnerText 
var innerText = doc.DocumentNode.InnerText;

 עִברִית