gpt4 book ai didi

c# - 获取html页面上的所有链接?

转载 作者:IT王子 更新时间:2023-10-29 03:57:54 26 4
gpt4 key购买 nike

我正在做一个业余爱好项目。我已经编写了获取 url、下载 header 并返回 mime 类型/内容类型的代码。

但是,这之前的步骤是我坚持的步骤 - 我需要检索基于标签内的页面上所有 url 的内容,并用引号括起来,即

...
<link rel='shortcut icon' href="/static/favicon.ico" type="image/x-icon" />
...

会找到网站图标链接。

.net 库中有什么有用的东西吗?还是这必须是正则表达式的情况?

最佳答案

我会考虑使用 Html Agility Pack .

这是一个直接来自他们的示例页面的示例,说明如何在页面中查找所有链接:

 HtmlWeb hw = new HtmlWeb();
HtmlDocument doc = hw.Load(/* url */);
foreach(HtmlNode link in doc.DocumentNode.SelectNodes("//a[@href]"))
{

}

关于c# - 获取html页面上的所有链接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2248411/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com