gpt4 book ai didi

c# - HTMLAgilityPack 剥离 html

转载 作者:行者123 更新时间:2023-11-30 22:41:42 27 4
gpt4 key购买 nike

我敢肯定这个问题以前有人问过,但我已经看过了,但找不到答案,或者我只是做错了什么。

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(indivdualfix[0]);
HtmlWeb hwObject = new HtmlWeb();
HtmlAgilityPack.HtmlDocument htmldocObject = hwObject.Load(indivdualfix[0]);
HtmlNode body = htmldocObject.DocumentNode.SelectSingleNode("//body");
body.Attributes.Remove("style");
foreach (var a in body.Attributes.ToArray())
a.Remove();
string bodywork = body.InnerHtml.ToString();

字符串主体仍然返回所有的html编码。我可能在这里遗漏了一些非常小的东西。基本上删除所有 html 编码需要做什么。

最佳答案

使用 body.InnerText 而不是 body.InnerHtml

关于c# - HTMLAgilityPack 剥离 html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4727547/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com