gpt4 book ai didi

c# - 没有任何html标签的元素的节点名称是什么?

转载 作者:可可西里 更新时间:2023-11-01 14:44:00 26 4
gpt4 key购买 nike

我想从 html 文档中删除没有 html 标签的文本。我正在使用 LINQ。

 doc.DocumentNode.Descendants().Where(d => d.Name == "script" 
|| d.Name == "style"
|| d.NodeType == HtmlNodeType.Comment)
.ToList()
.ForEach(d => d.Remove());

我正在使用这段代码。我想在 LINQ 中再添加一个条件,这样我就可以删除任何没有标签的文本。

<div>hello</div>hello world

结果,我只想说“你好”。现在我收到“hellohello world”。

请帮我解决这个问题。有没有办法使用 LINQ 命令删除此文本?我有一个想法,如果我知道没有标签的后代的名字,那么我可以通过简单地添加一个条件来解决它。

最佳答案

让我们尝试删除任何未标记的文本:

    doc.DocumentNode.Descendants()
.Where(d => d.NodeType == HtmlNodeType.Text && d.ParentNode.Equals(doc.DocumentNode))
.ToList()
.ForEach(d => d.Remove());

关于c# - 没有任何html标签的元素的节点名称是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33080356/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com