gpt4 book ai didi

c - 如何读/写非 ascii 字符?

转载 作者:太空宇宙 更新时间:2023-11-04 01:43:46 25 4
gpt4 key购买 nike

我正在尝试输入一个文件并让它一次打印每个字符,但有些字符被忽略了。我假设那是因为它们不是 ascii 字符,并且 fgets 不知道如何处理它们,因为缓冲区是由字符组成的。

int main() {
while(1)
{
char str[50];
if (fgets(str, 50, stdin) == NULL)
{
exit(0);
}
for(int i = 0; str[i] != '\n' ; i++)
{
printf("%lc", str[i]);
}
printf("\n");
}
return 0;
}

我有一个文件

ALICE’SE’E’E’E’E’E’

但我的代码输出为

ALICESEEEEEE

最佳答案

如果您使用 fgets(),输入字符(如 \0)可能会有一些未定义的行为,因为它们由 string 用于标记字符串中数据结束的函数。

fgets() 是一个面向文本的函数,它读取输入直到找到换行符 \n。然后它会在它后面放置一个 \0,这样您就知道字符串在哪里结束了。

但是对于二进制数据,您可以获得控制字符,甚至是空字符在数据流的中间,有时会使字符在输出时消失(因为它们已被读取,但您的代码没有当稍后在写作中遇到其中一些时,再进一步。

如果你想允许所有二进制字符,这里有几种方法:

  1. 使用 stdio 中的二进制流副本:fread(3)fwrite(3) 函数也允许您读取二进制数据作为文本:
#include <stdio.h>
#include <stdlib.h> /* for EXIT_* constants and exit() */
#define N (8192) /* buffer size (guessed, probably not optimum) */
int main()
{
ssize_t n;
char buffer[N];
while((n = fread(buffer, sizeof buffer[0], N, stdin)) > 0) {
ssize_t nout = fwrite(buffer, sizeof buffer[i], n, stdout);
if (nout != n) { /* error */
fprintf(stderr, "Error writing stdout\n");
exit(EXIT_FAILURE);
}
}
exit(EXIT_SUCCESS);
} /* main */
  1. 使用“The C programming language”一书中的简单 Kernighan & Ritchie 示例(我添加了一些错误处理代码):
#include <stdio.h>
#include <stdlib.h> /* idem. */
int main()
{
while((c = fgetc(stdin)) != EOF)
if (fputc(stdout) == EOF) {
fprintf("fputc error\n");
exit(EXIT_FAILURE);
}
}
if (ferror(stdin)) {
fprintf("fgetc error\n");
exit(EXIT_FAILURE);
}
exit(EXIT_SUCCESS);
} /* main */
  1. 或使用标准的 UNIX 系统调用:
#include <unistd.h>  /* for prototypes for read()/write() syscalls */
#include <stdio.h>
#include <stdlib.h>
#define N (8192) /* guessed buffer size */
int main()
{
char buffer[N];
ssize_t n;
while ((n = read(0, buffer, sizeof buffer)) > 0) {
ssize_t nout;
nout = write(1, buffer, sizeof buffer));
if (nout != n) {
fprintf(stderr, "write: %s\n", strerror(errno));
exit(EXIT_FAILURE);
}
}
if (n < 0) {
fprintf(stderr, "read: %s\n", strerror(errno));
exit(EXIT_FAILURE);
}
exit(EXIT_SUCCESS);
} /* main */

但请注意,您将获得的最高效代码可能是来自 K&R 书中的原始面向字符示例,因为 stdio 将选择最佳缓冲区大小,使其运行速度更快,尽管循环执行次数较多。

注意

无论如何,你的输出将远远不是你想要的,因为一些控制字符不会输出到终端,而是被解释为控制字符(最流行的是 \n,这使得终端继续下一行)你还必须处理这个问题。

即使您将多字节字符读取为单字节,您也可以使用给出的示例处理这些字符,因为使用两个字节的字符将被读取为两个,但在打印时,它们将成为终端应显示的单个字符.只要您不对数据流应用任何转换,输出与上面的示例代码片段就没有区别。

关于c - 如何读/写非 ascii 字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57848450/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com