gpt4 book ai didi

C文本处理: Output Wrong Size

转载 作者:行者123 更新时间:2023-11-30 15:29:38 25 4
gpt4 key购买 nike

我正在编写一个 ac 程序,该程序接受单词的文本文件,并且仅复制不带大写或标点符号的单词,并且长度为 4 个或更多字符。我已经测试了 bool 函数 int containsPunctuationOrCaps(char *word) 和 int longThanThree(char *word) ,它们都有效。但是,我的主函数仅打印至少七个字符的单词,任何更长的字符都会被截断。

int main() {
char *currentWord = malloc(36);
int count = 0;
char *Words[3000];
FILE *fin, *fout;

fin = fopen(INFILE,"r");
if (fin==NULL) {
printf("INPUT FILE NOT FOUND\n");
return 1;
}
while(fgets(currentWord, sizeof(currentWord), fin) != NULL) {
if(!containsPunctuationOrCaps(currentWord) && longerThanThree(currentWord)) {
Words[count]=currentWord;
printf("%s\n",currentWord);
count++;
}
}
fclose(fin);
}

当我改变的时候 char *currentWord = malloc(36);到 字符当前Word[];它不读取任何内容。我怎样才能做到这一点?

最佳答案

您将 currentWord 声明为 char *,它指向动态分配的内存。 sizeof 在编译时求值,并求出类型 currentWord 所需的大小(以字节为单位) - 在您的情况下,存储内存地址/指针所需的大小,在您的系统上显然是 8 个字节。由于 fgets 附加了一个终止 \0 字节,因此 fgets 调用仅读取 7 个字符。

您可以将 char *currentWord = malloc(36);(注意:您永远不会释放分配的内存)替换为 char currentWord[36];,这应该会导致至少读取 35 个字符。但是,fgets 始终尝试读取,直到行尾(或直到缓冲区已满),因此 currentWord 数组将包含多个单词。

您可以在空格处分割 currentWord,但这需要在缓冲区末尾进行额外的检查逻辑(即 currentWord 的末尾是单词的末尾/行,或者缓冲区刚刚满并且单词继续?)。完成您想要的操作的最简单方法可能是逐个字符读取文件(使用 getc ,但您应该确保使用缓冲 I/O,请参阅 setbuf )。当您读取每个字符时,您会检查它是单词字符还是非单词字符(或 EOF)。在前一种情况下,您将附加到缓冲区,而在后一种情况下,如果单词符合您的条件,则输出该单词,但首先附加一个 \0 终止符。 currentWord 缓冲区应该动态分配(除非您知道字长的明确上限),如果当前读取的字长于分配的内存可以容纳的长度,则可能必须重新分配它。

关于C文本处理: Output Wrong Size,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26153068/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com