gpt4 book ai didi

c#-4.0 - 如何知道C#中的字符串编码

转载 作者:行者123 更新时间:2023-12-03 03:42:09 29 4
gpt4 key购买 nike

我从我无法控制的第三方程序中获取了一个字符串。我的代码以 HTML 格式输出。这在英语中效果很好,但在其他语言中它会以一种有趣的方式显示。例如,西类牙语的口音看起来很有趣,而东方语言(即韩语)的字符看起来很有趣。我非常确定我需要做一些编码工作以便所有语言都能正确显示。

我对编码的理解有点差,所以在发布真正的问题之前,我直观地认为它是:“如何在 C# 中将其编码为 UTF-8”,我想对此事有更多的了解通过发布更简单的问题。

我的问题是:我如何知道我的输入字符串采用哪种编码类型?在西类牙语中,当我听到重音时,它看起来像这样:“Acción”,而不是“Acción” ”。这是 ANSI 还是我正在处理的问题?

提前非常感谢!

最佳答案

I get an accent: "Acción"

à 字符的存在是一个致命的泄露。重音大写 A 字符的字符代码为 0xC0 及以上。这通常是两字节 utf-8 编码字符中的第一个字节。 ó 字形是代码点 U+00F3,它的 utf-8 编码是 0xC3 + 0xB3。 à 和 ³ 的代码点是哪些

字符串以 utf-8 编码,但您正在使用 Encoding.Default 等 8 位编码读取它

关于c#-4.0 - 如何知道C#中的字符串编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13993135/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com