gpt4 book ai didi

c++ - getline 和 "strange characters"的问题

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:07:37 25 4
gpt4 key购买 nike

我有一个奇怪的问题,我用

wifstream a("a.txt");
wstring line;
while (a.good()) //!a.eof() not helping
{
getline (a,line);
//...
wcout<<line<<endl;

}

它可以很好地处理这样的 txt 文件 http://www.speedyshare.com/files/29833132/a.txt(抱歉链接,但它只有 80 个字节,所以如果我在 SO 换行符上 c/p 丢失,那么获取它应该不是问题)但是当我将例如水(来自 http://en.wikipedia.org/wiki/UTF-16/UCS-2#Examples )添加到作为加载停止的行的任何行时。我的错误印象是将 wstring 作为一个输入而将 wifstream 作为其他输入的 getline 可以咀嚼任何 txt 输入...有没有办法读取文件中的每一行,即使它包含时髦的字符?

最佳答案

不太令人满意的答案是,您需要为输入流注入(inject)一个能够理解所讨论的特定字符编码的语言环境。如果您不知道选择哪个语言环境,可以使用空语言环境。

例如(未经测试):

std::wifstream a("a.txt");
std::locale loc("");
a.imbue(loc);

不幸的是,没有标准的方法来确定给定平台可用的语言环境,更不用说根据字符编码选择语言环境了。

上面的代码将语言环境选择交到用户手中,如果他们将其设置为合理的东西(例如 en_AU.UTF-8),它可能一切正常。

否则,您可能需要求助于第三方库,例如 iconvICU .

也与此相关blog entry (为 self 推销道歉)。

关于c++ - getline 和 "strange characters"的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7040310/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com