gpt4 book ai didi

c# - HtmlAgilityPack 不返回 div 内的文本

转载 作者:太空宇宙 更新时间:2023-11-03 16:21:42 25 4
gpt4 key购买 nike

这是示例 html 页面,

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
<html version="-//W3C//DTD XHTML 1.1//EN" xmlns="http://www.w3.org/1999/xhtml" xml:lang="en">
<head>
<title>Test Page</title>
</head>
<body>
<div id="topContainer">
<div id="header">
<span>This is a Test message</span>
<span id="slogan">A sample slogan <br /> with 2 lines.</span>
</div>
<div id="news">
This is a test news
</div>
</div>
</body>
</html>

这是我的 C# 代码,

    public MainPage()
{
InitializeComponent();
HtmlWeb.LoadAsync("URL", DownLoadCompleted);

}

void DownLoadCompleted(object sender, HtmlDocumentLoadCompleted e)
{
if(e.Error == null)
{
HtmlDocument doc = e.Document;

if (doc != null)
{
var newsdiv = (from divnode in doc.DocumentNode.Descendants("div")
where divnode.Attributes["id"].Value == "header"
select divnode).FirstOrDefault();

var txtT = HttpUtility.HtmlDecode(newsdiv.InnerText);
txtDisplay.Text = txtT;

}
}
}

当我尝试检索 header 的 innerText 时div 它的工作原理。但是当我尝试使用相同的代码来检索 topContainer 的内部文本时div 它不返回任何东西。它也不会抛出错误。它对 <span> 根本不起作用元素。

可能是什么原因?

谢谢

最佳答案

似乎您正在尝试仅选择 ID 为 IDOFTHEDIV 的 div;因此不会选择具有其他 ID(或没有 ID)的其他 DIV

关于c# - HtmlAgilityPack 不返回 div 内的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13716216/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com