gpt4 book ai didi

asp.net - 将 S-JIS 字符串解码为 UTF-8

转载 作者:行者123 更新时间:2023-12-02 19:08:29 24 4
gpt4 key购买 nike

我正在处理日语文件,但我对此语言一无所知。该文件采用 S-JIS 编码。现在,我应该将内容转换为 UTF-8,以便内容看起来像日语。而我在这里完全一片空白。我尝试了在互联网上找到的以下代码,但没有成功:

byte[] arrByte = Encoding.UTF8.GetBytes(arrActualData[x]);
string str = ASCIIEncoding.ASCII.GetString(arrByte);

谁能帮我解决这个问题吗?

提前致谢库纳尔

最佳答案

在 C# 中,以下代码适用于我。我想尝试一下,所以我的结果证据如下:

public void Convert()
{
using (TextReader input = new StreamReader(
new FileStream("shift-jis.txt", FileMode.Open),
Encoding.GetEncoding("shift-jis")))
{
using (TextWriter output = new StreamWriter(
new FileStream("utf8.txt", FileMode.Create), Encoding.UTF8))
{
var buffer = new char[512];
int len;

while ((len = input.Read(buffer, 0, 512)) > 0)
{
output.Write(buffer, 0, len);
}
}
}
}

此处显示的是使用 shift-jis (或 SJIS/Shift_JIS they are the same )编码的文件,使用 JEdit验证编码(文件中的单词是日语文本テsuto,意思是测试):
alt text

运行代码并打开写入 (utf8.txt) 的文件后:
alt text

但应该说,这样的文件转换并不严格要求具备任何语言知识。

关于asp.net - 将 S-JIS 字符串解码为 UTF-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4623752/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com