gpt4 book ai didi

HTML 敏捷包解析

转载 作者:太空宇宙 更新时间:2023-11-04 15:16:36 26 4
gpt4 key购买 nike

我是 HTML Agility Pack 的新手。我正在尝试查找一些文档,但遇到了一些问题。

我有以下代码:

<div class="person">
<a href="blah1.html">Person 1</a>
</div>
<div class="person">
<a href="blah2.html">Person 2</a>
</div>
<div class="person">
<a href="blah3.html">Person 3</a>
</div>
<div class="person">
<a href="blah4.html">Person 4</a>
</div>

使用解析器,我如何才能只抓取具有类 person 的 div 中的链接?

谢谢!

最佳答案

Html Agility Pack (在 NuGet 上可用):

HtmlDocument html = new HtmlDocument();
html.Load(path_to_html); // or html.LoadHtml(html_string)
var links = html.DocumentNode.SelectNodes("//div[@class='person']/a")
.Select(n => n.GetAttributeValue("href", null));

返回:

"blah1.html"
"blah2.html"
"blah3.html"
"blah4.html"

关于HTML 敏捷包解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14530280/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com