gpt4 book ai didi

c# - 在不使用浏览器控件的情况下从字符串获取 HtmlDocument

转载 作者:行者123 更新时间:2023-11-30 19:29:56 26 4
gpt4 key购买 nike

我使用 WebClient 获取网页的 html 代码(作为字符串)。

但是我想将它变成一个 HtmlDocument 对象,这样我就可以使用这个类提供的 DOM 特性。目前我知道的唯一方法是使用浏览器控件,如下所示:

            string pageHtml = client.DownloadString(url);

browser.ScriptErrorsSuppressed = true;

browser.DocumentText = pageHtml;

do
{
Application.DoEvents();

} while (browser.ReadyState != WebBrowserReadyState.Complete);

return browser.Document;

还有其他方法吗?我知道还有其他可用的浏览器控件,但有没有更简单的方法?

最佳答案

您可以使用 HtmlAgilityPack .... 例如:

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);

var results = doc.DocumentNode
.Descendants("div")
.Select(n => n.InnerText);

关于c# - 在不使用浏览器控件的情况下从字符串获取 HtmlDocument,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10633189/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com