- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我编写了一个简单的代码,将一个非常大的文件读入内存。 (该文件大小约为 480 兆字节)。该文件包含一些逗号分隔的 0 和 1 值。该代码相当简单。我首先获取文件大小,然后分配足够的缓冲区空间,读取文件,用逗号分隔,然后将其放入数组中。程序如下:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int main(){
long no_of_houses = 1048576L; //dimensions of my final table.
int no_of_appliances = 5;
int no_of_sectors = 48;
int* intended_schedule; // this is where the table will be stored.
intended_schedule = (int*) malloc(no_of_houses * no_of_appliances * no_of_sectors * sizeof(int));
FILE* fptr = fopen("./data/houses.csv", "r"); //this file is around 480 mega bytes.
if(fptr == NULL){
perror("housese file");
exit(0);
}
fseek(fptr, 0L, SEEK_END); //find the size of the file before allocating space
long size = ftell(fptr);
rewind(fptr);
char* buffer = (char*) calloc(1, size); //now we know the size, we can allocate space.
fread(buffer, size, 1, fptr);
char* token = strtok(buffer, ",\n"); //it's a comma separated file. So break from comma
long no = 0;
while(token != NULL){
if(no == no_of_houses*no_of_appliances*no_of_sectors)
break; //guard against unexpectedly big data file.
intended_schedule[no] = token[0] - 48;// it's either 0 or 1. So this is good enough
no++;
token = strtok(NULL, ",\n");
}
fclose(fptr);
free(intended_schedule);
free(buffer);
return 0;
}
我使用这段代码作为一个更大程序的函数,因为它给了我错误,所以我通过 valgrind 运行这个程序。这是我得到的结果:
goodman@node2 analyse_code]$ valgrind ./analyse
==39263== Memcheck, a memory error detector
==39263== Copyright (C) 2002-2017, and GNU GPL'd, by Julian Seward et al.
==39263== Using Valgrind-3.13.0 and LibVEX; rerun with -h for copyright info
==39263== Command: ./analyse
==39263==
==39263== Warning: set address range perms: large range [0x51f8040, 0x411f8040) (undefined)
==39263== Warning: set address range perms: large range [0x59e3f040, 0x77e3f040) (defined)
==39263== Warning: set address range perms: large range [0x59e3f040, 0x77e3f040) (defined)
==39263== Invalid read of size 1
==39263== at 0x4EBEDCC: strtok (in /usr/lib64/libc-2.17.so)
==39263== by 0x400997: main (analyse.c:36)
==39263== Address 0x77e3f040 is 0 bytes after a block of size 503,316,480 alloc'd
==39263== at 0x4C2B9B5: calloc (vg_replace_malloc.c:711)
==39263== by 0x400904: main (analyse.c:27)
==39263==
==39263== Invalid read of size 1
==39263== at 0x4EBEDFC: strtok (in /usr/lib64/libc-2.17.so)
==39263== by 0x400997: main (analyse.c:36)
==39263== Address 0x77e3f040 is 0 bytes after a block of size 503,316,480 alloc'd
==39263== at 0x4C2B9B5: calloc (vg_replace_malloc.c:711)
==39263== by 0x400904: main (analyse.c:27)
==39263==
==39263== Warning: set address range perms: large range [0x51f8028, 0x411f8058) (noaccess)
==39263== Warning: set address range perms: large range [0x59e3f028, 0x77e3f058) (noaccess)
==39263==
==39263== HEAP SUMMARY:
==39263== in use at exit: 0 bytes in 0 blocks
==39263== total heap usage: 3 allocs, 3 frees, 1,509,950,008 bytes allocated
==39263==
==39263== All heap blocks were freed -- no leaks are possible
==39263==
==39263== For counts of detected and suppressed errors, rerun with: -v
==39263== ERROR SUMMARY: 2 errors from 2 contexts (suppressed: 0 from 0)
我想知道为什么会出现这些错误。据我所知,我的代码没有问题。是不是我的数据太大了?我认为情况并非如此,因为我在具有 128 GB RAM 的服务器上运行此代码。
如有任何帮助,我们将不胜感激。
--pp古德曼
最佳答案
strtok()
假定一个以 NUL 结尾的字符串,您的缓冲区NOT以 NUL 结尾,因此 strtok() 将尝试超出缓冲区的末尾。但您可以不用 strtok()
和大缓冲区。
您不需要缓冲整个文件;对于像这样的简单情况,您可以使用单字符缓冲区逐步执行它。这将消耗更少的内存,并且速度也会明显加快(至少 2 倍)
<小时/> #include <stdio.h>
#include <stdlib.h>
#include <string.h>
int main(){
unsigned long no_of_houses = 1048576L; //dimensions of my final table.
unsigned int no_of_appliances = 5;
unsigned int no_of_sectors = 48;
unsigned long no = 0;
int ch;
unsigned int *intended_schedule; // this is where the table will be stored.
intended_schedule = malloc(no_of_houses * no_of_appliances * no_of_sectors * sizeof *intended_schedule);
FILE *fptr = fopen("./data/houses.csv", "r"); //this file is around 480 mega bytes.
if(!fptr) {
perror("housese file");
exit(0);
}
while(no < no_of_houses*no_of_appliances*no_of_sectors) {
ch = getc(fptr);
if (ch== EOF) break;
if (ch== '\n') continue;
if (ch== ',') continue;
intended_schedule[no++] = ch - '0'; // it's either 0 or 1. So this is good enough
}
fclose(fptr);
free(intended_schedule);
return 0;
}
关于c - valgrind 显示内存较大的 strtok 错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50492305/
我正在寻找将数组中的单词与另一个数组中的字典中的单词进行比较,以查找找到的最大单词数 我使用了 strtok,因为两者中的单词都是用空格分隔的,但它不起作用。我需要你的帮助,请 void cherc
我在这个程序上花了几个小时,并花了几个小时在网上搜索我的方法的替代方案,但整个晚上都被崩溃和错误所困扰…… 我有几件事想用这段代码实现。首先我会解释我的问题,然后我会发布代码,最后我会解释我对这个程序
我希望使用 strtok() 解析以下字符串。 DINNER;NME=Tom Johnson;ADRES=1234 Street;TIME="12:00","15:00":Formal 有没有一种方法
这个问题在这里已经有了答案: Nested strtok function problem in C [duplicate] (2 个答案) 关闭 6 年前。 我意识到标题令人困惑,想不出更清晰的措
只是为了好玩,我正在编写一个程序,它将接受用户输入的字符串(甚至可能是文本文档)并打乱字符串中的单词。 我正在尝试使用 strtok 函数来分隔字符串中的每个单词。目前我觉得我当前的 strtok 实
如果我欺骗了主题,我真的很抱歉,我在这里搜索它没有结果。 我有代码 void split(char* str, char* splitstr) { char* p; char sp
strtok() 函数使用静态变量。 因此它不是可重入的。并且不能用于解析多个字符串。 我想知道的是为什么 strtok() 是这样设计的? strtok_r() 应该是 strtok()。 这个函数
我是 C 编程的新手,目前正在努力使用 strtok。我想使用以下代码将一个字符串拆分为两个字符串(字符串是例如“Bat1:185”,分隔符是冒号): char batName[13]; char b
我正在写一个 C 程序来研究函数的用法 strtok() .这是我的代码: #include #include main() { char abc[100] = "ls &"; c
我正在尝试分割以下类型的行: GM 1 2 3 ! this is a comment 分离出评论部分。有几种可能的注释分隔符:!、' 和 #。 strtok 是明显的解决方案: card->card
我需要将 C 字符串划分为标记。我认为 strtok 将是我最好的尝试,但我得到了非常奇怪的结果...... 这是我的测试程序。在这个例子中,我将得到 3 个带有“##”分隔符的 token ,但是当
我正在使用库的 strtok(...) 并且它似乎工作正常,直到结束条件,导致段错误和程序崩溃。 API 声称 strtok(...) 将在找不到更多标记时输出 NULL,这意味着,我认为,您必须捕获
我有包含歌曲详细信息的链接列表,想要比较两个歌曲名称...附加任务是通过比不同单词更多的相似单词来比较它们...我使用 strtok 逐字获取它,然后检查如果当前单词包含在另一个名称中...但是当我这
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
我尝试编写一个函数,该函数获取指向字符数组的指针,从用户读取字符串并删除字符串开头的所有空格,直到出现第一个不是字符串的字符。最后返回开头不带空格的字符串副本。 例如, 对于输入abcd,函数应返回指
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 3 年前。 Improve th
当我尝试分离 token “(555) 333-444”时,下面的代码没有给出所需的输出。我需要函数来分别分离所有这些 555、333、444。我的错误可能是什么? 输出: 555 333-444 #
这个问题已经有答案了: How does strtok() split the string into tokens in C? (16 个回答) 已关闭 7 年前。 抱歉,这可能是一个愚蠢的问题,但
#include #include #include #define MAX_INPUT_LENGTH 1024 char *readline(FILE* fp, int max_length)
已关闭。这个问题是 not reproducible or was caused by typos 。目前不接受答案。 这个问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-top
我是一名优秀的程序员,十分优秀!