gpt4 book ai didi

c# - 阅读 HTML?

转载 作者:太空宇宙 更新时间:2023-11-04 13:55:53 26 4
gpt4 key购买 nike

我正在用 C# 开发一个程序,我需要一些帮助。我正在尝试创建一个数组或项目列表,显示在某个网站上。我想要做的是阅读 anchor 文本,它是 href。例如,这是 HTML:

<div class="menu-1">
<div class="items">
<div class="minor">
<ul>
<li class="menu-item">
<a class="menu-link" title="Item-1" id="menu-item-1"
href="/?item=1">Item 1</a>
</li>
<li class="menu-item">
<a class="menu-link" title="Item-1" id="menu-item-2"
href="/?item=2">Item 2</a>
</li>
<li class="menu-item">
<a class="menu-link" title="Item-1" id="menu-item-3"
href="/?item=3">Item 3</a>
</li>
<li class="menu-item">
<a class="menu-link" title="Item-1" id="menu-item-4"
href="/?item=4">Item 4</a>
</li>
<li class="menu-item">
<a class="menu-link" title="Item-1" id="menu-item-5"
href="/?item=5">Item 5</a>
</li>
</ul>
</div>
</div>
</div>

所以我想从那个 HTML 中读到这个:

string[,] array = {{"Item 1", "/?item=1"}, {"Item 2", "/?item=2"},
{"Item 3", "/?item=3"}, {"Item 4", "/?item=4"}, {"Item 5", "/?item=5"}};

HTML 是我写的示例,实际站点看起来不是那样。

最佳答案

正如其他人所说,HtmlAgilityPack 是 html 解析的最佳选择,还请确保从 HtmlAgilityPack 站点下载 HAP Explorer,用它来测试您的选择,无论如何,此 SelectNode 命令将获取所有具有 ID 的 anchor ,它以 menu-item 开头:

  HtmlDocument doc = new HtmlDocument();
doc.Load(htmlFile);
var myNodes = doc.DocumentNode.SelectNodes("//a[starts-with(@id,'menu-item-')]");
foreach (HtmlNode node in myNodes)
{
Console.WriteLine(node.Id);

}

关于c# - 阅读 HTML?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10709378/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com