gpt4 book ai didi

c# - 将字符串的字符编码从 windows-1252 转换为 utf-8

转载 作者:可可西里 更新时间:2023-11-01 07:54:52 31 4
gpt4 key购买 nike

我已经将 Word 文档 (docx) 转换为 html,转换后的 html 的字符编码为 windows-1252。在 .Net 中,对于这个 1252 字符编码,所有特殊字符都显示为“�”。此 html 显示在 Rad 编辑器中,如果 html 为 Utf-8 格式,则该编辑器可以正确显示。

我试过下面的代码,但没有静脉

Encoding wind1252 = Encoding.GetEncoding(1252);  
Encoding utf8 = Encoding.UTF8;
byte[] wind1252Bytes = wind1252.GetBytes(strHtml);
byte[] utf8Bytes = Encoding.Convert(wind1252, utf8, wind1252Bytes);
char[] utf8Chars = new char[utf8.GetCharCount(utf8Bytes, 0, utf8Bytes.Length)];
utf8.GetChars(utf8Bytes, 0, utf8Bytes.Length, utf8Chars, 0);
string utf8String = new string(utf8Chars);

关于如何将 html 转换为 UTF-8 有什么建议吗?

最佳答案

应该这样做:

Encoding wind1252 = Encoding.GetEncoding(1252);
Encoding utf8 = Encoding.UTF8;
byte[] wind1252Bytes = wind1252.GetBytes(strHtml);
byte[] utf8Bytes = Encoding.Convert(wind1252, utf8, wind1252Bytes);
string utf8String = Encoding.UTF8.GetString(utf8Bytes);

关于c# - 将字符串的字符编码从 windows-1252 转换为 utf-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5568033/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com