gpt4 book ai didi

c# - 如何获取多个标签的内文?

转载 作者:行者123 更新时间:2023-11-30 17:12:23 25 4
gpt4 key购买 nike

这是我的示例页面。我想将一个标签的所有内部文本都放到一个字符串中。我为此编写了代码,但它无法正常工作

<body>
<div id="infor">
<div id="genres">
<a href="#" >Animation</a>
<a href="#" >Short</a>
<a href="#" >Action</a>
</div>
</div>
</body>

我想将 All 标签的内部文本转换为一个字符串,我使用这段代码来实现它,但它无法正常工作。

class Values
{
private HtmlAgilityPack.HtmlDocument _markup;

HtmlWeb web = new HtmlWeb(); //creating object of HtmlWeb
form1 frm = new form1;

_markup = web.Load("mypage.html"); // load page

public string Genres
{
get
{
HtmlNodeCollection headers = _markup.DocumentNode.SelectNodes("//div[contains(@id, 'infor')]/a"); // I filter all of <a> tags in <div id="infor">
if (headers != null)
{
string genres = "";
foreach (HtmlNode header in headers) // I'm not sure what happens here.
{
HtmlNode genre = header.ParentNode.SelectSingleNode(".//a[contains(@href, '#')]"); //I think an error occurred in here...
if (genre != null)
{
genres += genre.InnerText + ", ";
}
}
return genres;
}
return String.Empty;
}
}

frm.text1.text=Genres;
}

text1(返回值)是:

Animation, Animation, Animation,

但我想要这样的输出:

Animation, Short, Action,

最佳答案

我认为,使用一点 Linq 和使用 Descendants 会让你更容易做到这一点。

var genreNode = _markup.DocumentNode.Descendants("div").Where(n => n.Id.Equals("genre")).FirstOrDefault();
if (genreNode != null)
{
// this pulls all <a> nodes under the genre div and pops their inner text into an array
// then joins that array using the ", " as separator.
return string.Join(", ", genreNode.Descendants("a")
.Where(n => n.GetAttributeValue("href", string.Empty).Equals("#"))
.Select(n => n.InnerText).ToArray());
}

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com