API Java Saor in Aisce chun HTML a Extract, Parse & Próiseáil
Leabharlann Java Foinse Oscailte le haghaidh Lódáil, Parseáil, Faighte URLanna, Extracting agus Manipulating Sonraí, ag úsáid na modhanna is fearr atá ar fáil i HTML5 DOM agus roghnóirí CSS.
Is leabharlann Java an-láidir é Jsoup a chuireann ar chumas forbróirí bogearraí déileáil le tascanna a bhaineann le HTML laistigh dá n-iarratais Java féin. Nuair a thagann sé chun scraping gréasáin agus parsing HTML i Java, tá Jsoup tar éis éirí mar leabharlann coitianta agus láidir. Cuireann sé bealach áisiúil agus intuigthe ar fáil chun sonraí a parse agus a bhaint as doiciméid HTML, an DOM a láimhseáil, agus struchtúr HTML a thrasnú go héasca. Is tionscadal oscailte é Jsoup a dháileadh faoi cheadúnas MIT leathan. Mar leabharlann Java, comhoibríonn Jsoup go réidh le tionscadail Java atá ann cheana, ag déanamh é mar rogha idéalach do forbróirí Java.
Is leabharlann Java saor in aisce é Jsoup a chuireann ar chumas forbróirí bogearraí sonraí a bhaint agus a mhodhnú ó doiciméid HTML agus XML. Feidhmíonn sé mar dhroichead áisiúil idir Java agus domhan na scriosadh gréasáin, ag tairiscint sraith láidir gnéithe chun ábhar HTML a fháil, a pharsáil, a mhodhnú, agus a thrasnú. Cibé an gá duit sonraí ar leith a bhaint ó leathanach gréasáin, leathanach a scriosadh, nó struchtúr doiciméad HTML a mhodhnú, cuireann Jsoup API atá éasca le húsáid ar fáil chun na tascanna seo a chur i gcrích.
Soláthraíonn an Jsoup API glan agus intuigthe a dhéanann sé éasca do thosaitheoirí agus tapa le foghlaim. Le modhanna simplí chun HTML a pharsáil, a mhodhnú, agus a thrasnú, is féidir le forbróirí tosú ag scrabadh sonraí gréasáin go tapa. Cuireann a inathraitheacht ar chumas forbróirí bogearraí feidhmeanna saincheaptha a thógáil ar bharr an leabharlainne. Tacaíonn sé le tréithe a shainmhínítear ag an úsáideoir, scagairí saincheaptha, agus trasnóirí saincheaptha, ag ligean do forbróirí bogearraí an leabharlann a oiriúnú dá ngá. Déanann a API intuigthe, i gcomhcheangal le raon leathan gnéithe, é a bheith ina rogha coitianta i measc forbróirí. Cibé an gá duit sonraí a bhaint, an DOM a mhodhnú, nó cásanna HTML casta a láimhseáil, cuireann Jsoup an próiseas simplí agus soláthraíonn sé réitigh láidre.
Ag Tús le Jsoup
Is é an bealach molta chun Jsoup a úsáid ná trí na comhoiriúnachtaí Maven nó Gradle riachtanacha a chur isteach nó trí an comhoiriúnacht JAR a allmhairiú go láimhe isteach i do thionscadal. Le do thoil, cuir an brabhsálaí maven leis chun oibriú réidh a chinntiú.
I'm sorry, but it seems there is no text provided for translation. Please share the English text you would like to have translated into Irish.Brabhsáil Jsoup Maven
<briseadh>
<groupId>org.jsoup</groupId>
<artifactId>Jsoup</artifactId>
<version>1.16.1</version>
</briseadh>
Suiteáil Leabharlann Jsoup trí Gradle
// jsoup HTML parser library @ https://jsoup.org/
implementation 'org.jsoup:jsoup:1.16.1'
Or Vig GitHub
git clone https://github.com/jhy/jsoup.git
cd jsoup
mvn install
Is féidir leat é a shuiteáil go láimhe freisin; íoslódáil na comhoibrithe is déanaí go díreach ó gheata GitHub.
Ag parseáil comhad HTML ag úsáid Java API
Duine de na feidhmeanna bunúsacha atá ag leabharlann Jsoup oscailte is ea a cumas chun doiciméid HTML a pharsáil laistigh de iarratais Java. Ceadaíonn an leabharlann sonraí a bhaint as doiciméid HTML ag úsáid URL a thagann le leathanach gréasáin, sreanga HTML amh, nó go díreach trí chomhad a luchtú ón diosca. Chun doiciméad HTML a pharsáil ag baint úsáide as Jsoup, is féidir le forbróirí bogearraí an modh Jsoup.parse() a úsáid. Glacann an modh seo le hábhar HTML mar shreang agus cuireann sé obiekt Doiciméad ar ais a léiríonn an HTML a pharsáil. Ón áit sin, is féidir le forbróirí an crann DOM a nascleanúint agus na heilimintí inmhianaithe a bhaint ag baint úsáide as roghnóirí nó modhanna trasnaíochta. Taispeánann an sampla seo conas leathanach gréasáin a pharsáil go DOM, agus na teidil a roghnú uaidh ag baint úsáide as ordaithe java.
Conas comhad HTML a pharsáil agus teidil a bhaint as trí API Java?
Document doc = Jsoup.connect("https://en.wikipedia.org/").get();
log(doc.title());
Elements newsHeadlines = doc.select("#mp-itn b a");
for (Element headline : newsHeadlines) {
log("%s\n\t%s",
headline.attr("title"), headline.absUrl("href"));
}
Sínigh Sonraí ó Fháilti HTML ag baint úsáide as Java
Tá feidhmeanna an-úsáideach curtha san áireamh ag leabharlann Jsoup chun sonraí a luchtú agus a bhaint as doiciméid HTML laistigh de iarratais Java. Cuireann an leabharlann modhanna intuigthe ar fáil chun sonraí a bhaint as eilimintí HTML. Tacaíonn sé le baint téacs, faighte tréithe, agus sraitheanna HTML, ag soláthar na n-uirlisí riachtanacha do dhéantóirí chun sonraí a bhaint agus a láimhseáil de réir mar is gá. Éascaíonn sé seo comhoiriúnacht feidhmeanna gréasáin a bhaint as laistigh de iarratais Java. Taispeánann an sampla seo conas is féidir le cláraitheoirí tréithe, téacs, agus HTML a bhaint as eilimintí laistigh de iarratais Java.
Conas Gnéithe, Téacs, agus HTML a bhaint as Éilimh trí API Java?
String html = "An example link.
";
Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();
String text = doc.body().text(); // "An example link"
String linkHref = link.attr("href"); // "http://example.com/"
String linkText = link.text(); // "example""
String linkOuterH = link.outerHtml();
// "example"
String linkInnerH = link.html(); // "example"
Cuir in Eagar agus Manipulate comhoibrithe HTML trí Java API
Ceadaíonn an leabharlann Jsoup, atá oscailte do fhoinsí, do dhéantóirí bogearraí doiciméid HTML a luchtú agus a mhodhnú go héasca laistigh dá n-iarratais Java féin. Cibé an bhfuil sé ag cur, ag baint, nó ag modhnú eilimintí, cuireann Jsoup API áisiúil ar fáil chun struchtúr HTML a láimhseáil. Tá an ghné seo an-tábhachtach nuair a bhíonn sonraí á gcrapadh agus á gcoimeád i bhfoirm inmhianaithe nó nuair a bhíonn uirlisí á gcur le chéile a mhodhnóidh ábhar HTML go clárnach.