gpt4 book ai didi

c# - 用于从文本文件中读取意大利语字符的正确编码

转载 作者:行者123 更新时间:2023-11-30 15:28:02 26 4
gpt4 key购买 nike

我在尝试使用 C# 从文件中读取意大利语文本时遇到了一些问题。

//actual text in the file - può darsi che tu riesca

string sampleItalianText = "può";

string contents = File.ReadAllText(filepath);
bool hasMatch = contents.Contains(sampleItalianText);

//hasMatch is always false because contents has a strange symbol in place of ò

我试过了

File.ReadAllText(filepath, Encoding.GetEncoding(1144);  //IBM EBCDIC (Italy-Euro)      

但到目前为止还没有运气。

最终,当有匹配项时,我还必须将翻译后的文本(使用其他语言)写回同一个文件。

解决此问题的正确编码是什么?或者除了 ReadAllText() 之外,还有什么我可以使用的方法吗?

最佳答案

在读取文件之前你必须知道编码。 File.ReadAllText(string)将尝试检测根本不可靠的编码。如果可以,请读写 UTF-8,因为在 .NET 中采用默认设置的所有内容都将使用 UTF-8,并且您将避免使用不同语言的系统之间的转换问题。

在西方系统上下一个最流行的编码是 Windows-1252,所以通常情况下,如果一个文件没有被编码为 UTF-8,它被编码为 Windows-1252。如果您知道文件是在本地创建的,您也可以使用 Encoding.Default 来读取文件,但请不要使用它来写入文件。

关于c# - 用于从文本文件中读取意大利语字符的正确编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26487110/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com