gpt4 book ai didi

.net - 为什么 HtmlEncode 和 HtmlDecode 在 .NET 中不是同构的?

转载 作者:行者123 更新时间:2023-12-04 23:24:09 26 4
gpt4 key购买 nike

我觉得这很奇怪,也很烦人。

例子:

Decode(”) => ”
Encode(”) => ”

相关类:
.NET 4:   System.Net.WebUtility
.NET 3.5: System.Web.HttpUtility

我可以理解网页可以是 Unicode,但在我的情况下,输出不能是 UTF8。

有没有什么东西(也许是一个 HtmlWriter 类)可以做到这一点而我不必重新发明轮子?

替代解决方案:
string HtmlUnicodeEncode(string input)
{
var sb = new StringBuilder();

foreach (var c in input)
{
if (c > 127)
{
sb.AppendFormat("&#x{0:X4};", (int)c);
}
else
{
sb.Append(c);
}
}

return sb.ToString();
}

最佳答案

不可能产生同构的 HTML 编解码器对。考虑:

HtmlDecode("”””””") -> ”””””

你怎么从 ”””””回来到原始字符串?
HtmlEncode必须为 选择一种编码,它适用于 作为最短,最易读的替代方案。只要您使用 Unicode,那几乎肯定是最佳选择。

如果您不这样做,那就是另一个论点... ” 的优势是它比 ” 更具可读性,但它仅适用于 HTML(而不是 XML)并且您仍然必须回退到所有没有内置实体名称的 Unicode 字符的字符引用,因此它不太一致。对于字符引用编码器,创建一个 XmlTextWriter 使用 ASCII 编码并调用 writeString 在上面。

关于.net - 为什么 HtmlEncode 和 HtmlDecode 在 .NET 中不是同构的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16057398/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com