gpt4 book ai didi

c# - 如何使用ScrapySharp解析html文档中的元素?

转载 作者:太空狗 更新时间:2023-10-29 14:56:03 25 4
gpt4 key购买 nike

这是项目官方“文档”:

https://bitbucket.org/rflechner/scrapysharp/wiki/Home


无论我尝试什么,我都找不到库应该添加的 CssSelect() 方法,以便于查询。这是我尝试过的:

using ScrapySharp.Core;
using ScrapySharp.Html.Parsing;
using HtmlAgilityPack;

HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load("http://www.stackoverflow.com");

var page = doc.DocumentNode.SelectSingleNode("//body");
page.CssSel???

我究竟该如何使用这个库?在文档中不清楚 html 是什么类型。

最佳答案

添加

using ScrapySharp.Extensions;

看来你错过了。这应该使 CssSelect 可用。

为了以防万一,这里还有一个我在项目中使用的方法:

private string GetPdfUrl(HtmlDocument document, string baseUrl)
{
return new Uri(new Uri(baseUrl), document.DocumentNode.CssSelect(".table-of-content .head-row td.download a.text-pdf").Single().Attributes["href"].Value).ToString();
}

关于c# - 如何使用ScrapySharp解析html文档中的元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15725305/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com