gpt4 book ai didi

c - 使用 fread() 和 printf() 读取和打印汉字?

转载 作者:太空宇宙 更新时间:2023-11-04 03:39:32 25 4
gpt4 key购买 nike

我正在尝试从 infile 中读取汉字,我在这里发现了一些关于这个主题的问题,但没有一个对我有用或适合我的需要。我正在使用 this question 中的 fread() 实现,但它不起作用。我正在运行 Linux。

  #define UNICODE
#ifdef UNICODE
#define _UNICODE
#else
#define _MBCS
#endif

#include <locale.h>
#include <stdio.h>
#include <wchar.h>
#include <string.h>
#include <stdlib.h>
int main(int argc, char * argv[]) {
FILE *infile = fopen(argv[1], "r");
wchar_t test[2] = L"\u4E2A";
setlocale(LC_ALL, "");
printf("%ls\n", test); //test
wcscpy(test, L"\u4F60"); //test
printf("%ls\n", test); //test
for (int i = 0; i < 5; i++){
fread(test, 2, 2, infile);
printf("%ls\n", test);
}
return 0;
}

我使用下面的文本文件来测试它:

 一个人
两本书
三张桌子
我喜欢一个猫

和程序输出:



������

有人对这个问题有什么看法吗?

编辑:此外,这就是我的所有代码,因为我不确定它在哪里失败。我在那里测试了一些东西,以确保我可以打印与问题不完全相关的 unicode wchars。

最佳答案

如果您确实需要一次读取一个 UTF-8(或者更确切地说是语言环境字符映射)文件一个代码点,您可以使用 fscanf,如下所示。但请注意,这是代码点而不是字符,由于组合代码,字符可能由多个代码点组成,并且某些代码点绝对不可打印。

#include <locale.h>
#include <stdio.h>
#include <wchar.h>
#include <string.h>
#include <stdlib.h>
int
main(int argc, char *argv[])
{
FILE *infile = fopen(argv[1], "r");
wchar_t test[2] = L"\u4E2A";
setlocale(LC_ALL, "");
printf("%ls\n", test); //test
wcscpy(test, L"\u4F60"); //test
printf("%ls\n", test); //test
for (int i = 0; i < 5; i++) {
fscanf(infile, "%1ls", test);
printf("%ls\n", test);
}
return 0;
}

大多数时候您可能不需要使用语言环境功能,因为 UTF-8 通常只在您将其视为不透明编码时才有效。部分原因是因为 所有 非 ASCII 字符的 所有 它们的组成字节在 128..253 范围内(不是拼写错误,254 和 255 未使用)另一部分是字节 128..159 始终是连续字节 字符 的所有起始字节都是 160..253,这意味着错误只会破坏一个字符而不是流的其余部分。 (好吧,代码点与字符只是为了让你相信将 UTF-8 分成“字符”可能不会做你想要的)。

关于c - 使用 fread() 和 printf() 读取和打印汉字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29734754/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com