gpt4 book ai didi

c# - 使用 HTMLAgility Pack 提取链接

转载 作者:行者123 更新时间:2023-11-30 15:10:47 25 4
gpt4 key购买 nike

考虑这段最简单的代码:

    using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using HtmlAgilityPack;

namespace WebScraper
{
class Program
{
static void Main(string[] args)
{
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml("http://www.google.com");

foreach (HtmlNode link in doc.DocumentNode.SelectNodes("//a[@href]"))
{
}
}
}
}

这实际上根本没有做任何事情,并且是从各种其他 StackOverflow 问题(例如 this)中复制/启发的.编译时,出现运行时错误,提示“对象引用未设置为对象的实例”。突出显示 foreach 行。

我不明白,为什么环境对这段不起眼、天真无用的代码变得烦躁。

我也想知道,HTMLAgilityPack 是否接受 HTML 类作为节点?

最佳答案

如果你想从网络加载html,你需要使用HtmlWeb对象:

HtmlWeb web = new HtmlWeb();
HtmlDocument doc =web.Load(url);

关于c# - 使用 HTMLAgility Pack 提取链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2980094/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com