gpt4 book ai didi

c# - 解码所有 HTML 实体

转载 作者:IT王子 更新时间:2023-10-29 04:29:02 25 4
gpt4 key购买 nike

我正在寻找一些可以解码大量 HTML 实体的函数。

原因是我正在编写一些代码以获取 HTML 内容并将其转换为纯文本,我遇到的问题是很多实体使用 HttpUtility.HtmlDecode 进行转换

我关注的一些实体示例是  、&、©。

这适用于 .net 3.5

最佳答案

那么您可能需要HttpUtility.HtmlDecode?。它应该可以工作,您只需要添加对 System.Web 的引用。至少在 .Net Framework < 4 中是这样。

例如下面的代码:

MessageBox.Show(HttpUtility.HtmlDecode("&amp;&copy;"));

工作正常,输出符合预期(& 符号和版权符号)。您确定问题出在 HtmlDecode 而不是其他地方吗?

更新:另一个能够完成这项工作的类 WebUtility(同样是 HtmlDecode 方法)出现在较新版本的 .Net 中。但是,它似乎存在一些问题。查看HttpUtility vs. WebUtility问题。

关于c# - 解码所有 HTML 实体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8348879/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com