gpt4 book ai didi

c# - 获取网页的所有 anchor 标签

转载 作者:太空宇宙 更新时间:2023-11-03 19:34:58 25 4
gpt4 key购买 nike

给定一个网址,我想检测一个网站中的所有链接,识别内部链接并列出它们。

我的是这样的:

            WebClient webClient = null;
webClient = new WebClient();

string strUrl = "http://www.anysite.com";
string completeHTMLCode = "";

try
{
completeHTMLCode = webClient.DownloadString(strUrl);
}
catch (Exception)
{
}

使用它我可以阅读页面的内容....但我脑子里唯一的想法是解析这个字符串....搜索<a然后href然后是双引号之间的值。

这是唯一的出路吗?或者还有其他更好的解决方案?

最佳答案

使用 HTML Agility Pack .这是 blog post 的链接让你开始。不要使用正则表达式。

关于c# - 获取网页的所有 anchor 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2318114/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com