gpt4 book ai didi

c# - 获取 html 标签 Xpath 和 HtmlAgility 之间的值

转载 作者:行者123 更新时间:2023-11-28 01:52:28 31 4
gpt4 key购买 nike

到目前为止,我正在尝试检索某个网站的 HTML 标记之间的文本....

例如,我需要提取出这些 span 标签之间的文本,我将如何处理,我收到一条错误消息,指出“对象引用未设置为对象的实例”,这里是 HTML

这里还有这部分之前的 HTML 代码;我不知道这是否应该有所作为。

<div class="thumbnail-details">
<ul>
<li> … </li>
<li class="product-title">
<span class="thumbnail-details-grey">The Blaster Portable Wireless Speaker in Black</span>
</li>
<li> … </li>
</ul>
</div>

到目前为止我的C#代码是

    HtmlWeb hw = new HtmlWeb();
HtmlAgilityPack.HtmlDocument htmlDoc = hw.Load(@"http://www.karmaloop.com/Browse.htm#Pgroup=1");
if (htmlDoc.DocumentNode != null)
{
foreach (HtmlNode text in htmlDoc.DocumentNode.SelectNodes("//span[@class='thumbnail-details-grey']/text()"))
{
Console.WriteLine(text.InnerText);
}

我能在这里得到一些帮助吗,我想提取“The Blaster Portable Wireless Speaker in Black”。

最佳答案

我建议使用 CsQuery ( https://www.nuget.org/packages/CsQuery/1.3.4 ),它非常简单:

var doc = CQ.CreateFromUrl(@"http://www.karmaloop.com/Browse.htm");
var nodes = doc.Find("span.thumbnail-details-grey");
foreach(var node in nodes)
Console.WriteLine(node.InnerText);

关于c# - 获取 html 标签 Xpath 和 HtmlAgility 之间的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19231851/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com