- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在尝试使用 mmap 循环读取文件,我的文件包含有关 3 个部分的信息,第一部分的大小为 3*sizeof(double),第二个也是 3*sizeof(double) 的大小,第三个也是 sizeof(double) 的大小。在文件的第一部分,我有 HEADER 大小为 32768 字节。组织的文件:
标题||部分(1),部分(1)....部分(1)||部分(2),部分(2)....部分(2)||部分(3),部分(3)....第(3)部分|
每个部分我有100次。我想每次处理 30 个部分(每个部分 10 个部分)。
我试过这段代码:
void readingFile(FILE *file, double *a, double *b, double *c, int start, int end, int chunksz, long total)
{
int i = 0;
int size = end - start + 1;
int fd;
fd = fileno(file);
off_t fullsize = lseek(fd,SEEK_CUR,SEEK_END); //getting the file size
fullsize-=1;//the lseek gives one more byte, its ok!
unsigned long summ = (unsigned long)(start-1)*chunksz; //chunk is 56
summ+=(unsigned long)HEADER_SIZE;//offset the header size
unsigned long paramm=(unsigned long)((unsigned long)summ/(unsigned long)(sysconf(_SC_PAGE_SIZE)));
unsigned long param = floor(paramm);
void *buf=NULL;
buf =mmap(NULL,fullsize , PROT_READ, MAP_PRIVATE , fd, param*sysconf(_SC_PAGE_SIZE));
if(buf==MAP_FAILED)
{
printf("we have an error\n");
}
unsigned long gapp = (sysconf(_SC_PAGE_SIZE))*param;
unsigned long gap =summ-gapp;
buf+=gap;
memcpy(a,buf,3*sizeof(double)*size);
buf+=(unsigned long)((long)total-(start-1))*3*sizeof(double);
buf+=((start-1)*3*sizeof(double));
memcpy(b,buf,3*sizeof(double)*size);
buf+=(unsigned long)((long)total-(start-1))*3*sizeof(double);
buf+=((start-1)*sizeof(double));
memcpy(c,buf,sizeof(double)*size);
munmap(buf, fullsize);
return;
}
在某个地方我有溢出和程序崩溃!每次调用该函数时,都会将新内存正确分配给 a,b,c。这里有什么?该进程在第 14 次迭代时崩溃:
memcpy(c,buf,sizeof(double)*size);
谢谢!
最佳答案
我知道用源代码回答一个问题并不熟悉。但我试图说明 mmap 有什么用处。基本上 mmap 使用内核功能将文件内容加载(并写回)到内存区域。所以我们不需要频繁调用read/seek 可以让你的应用程序更有效。另一方面,它是一种直接访问您的数据的舒适解决方案,只需查看代码:
#include <unistd.h>
#include <sys/mman.h>
#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
struct mapping
{
void* start_addr;
size_t length;
int fd;
};
struct mapping* map_file(const char* file)
{
struct mapping* ret = malloc(sizeof(struct mapping));
if(NULL == ret)
{
printf("Can't allocate memory for struct mapping.\n");
return NULL;
}
ret->fd = open(file, O_RDONLY);
if(0 > ret->fd)
{
perror("can't open specified file.");
free(ret);
return NULL;
}
struct stat fs;
if(0 != fstat(ret->fd, &fs))
{
perror("can't specify file size.");
close(ret->fd);
free(ret);
return NULL;
}
ret->length = fs.st_size;
//offset means offset in file
ret->start_addr = mmap(NULL, ret->length, PROT_READ, MAP_PRIVATE, ret->fd, 0);
if(MAP_FAILED == ret->start_addr)
{
perror("Mapping file failed.");
close(ret->fd);
free(ret);
return NULL;
}
return ret;
}
//returns zero on success and free the `struct mapping` data
int unmap_file(struct mapping* mmf)
{
//note that now we use read only mapping
//if you want to write this memory pages
//before detach maybe you have to call:
//msync(mmf->start_addr, mmf->length, MS_SYNC);
// avoid data loss (write all dirty page into file).
if(NULL != mmf->start_addr)
{
if(0 != munmap(mmf->start_addr, mmf->length))
{
perror("Can't munmap file.");
return 1;
}
}
mmf->start_addr = NULL;
if(-1 != mmf->fd)
{
if(0 != close(mmf->fd))
{
perror("can't close file descriptor.");
return 2;
}
}
free(mmf);
return 0;
}
// for test#define MAGIC_START_INDEX 0
#define MAGIC_START_INDEX 32768
int main(int arg_length, char** args)
{
if(arg_length < 2)
{
printf("No input file specified.\n");
exit(1);
}
int i = 0;
//first argument is the name of program
while(++i < arg_length)
{
struct mapping* mmf = map_file(args[i]);
if(NULL == mmf)
{
printf("can't use %s for input file\n", args[i]);
continue;
}
if(mmf->length > MAGIC_START_INDEX)
{
//upper base
int max_index = (mmf->length - MAGIC_START_INDEX) / sizeof(double);
//an offset alias for start memory address
double* data = ((double*)(mmf->start_addr + MAGIC_START_INDEX));
int ni = 0;
while(ni+2 < max_index)
{
printf("num0: %f, num1: %f, num2: %f\n", data[ni], data[ni+1], data[ni+2]);
ni += 3;
}
}
else
{
printf("File: %s has no valuable data.", args[i]);
}
unmap_file(mmf);
}
}
总的来说,你看,我们可以直接使用内存地址而不是重复读取操作。这是我复制的示例代码(存储在结构中的映射相关数据和相关函数负责创建/释放文件映射)。读取可以更偷懒,打开文件,读取大小(fstat)如果我有有值(value)的数据,使用mmap的offset参数跳过文件中的header部分:
double[] data = (double*)(mmap(NULL, file_length, PROT_READ, MAP_PRIVATE, fd, MAGIC_START_INDEX)); //TODO check null.
您可以“即时”访问数据。
关于c - 循环中的文件 mmap,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34674809/
我是 PHP 新手。我一直在脚本中使用 for 循环、while 循环、foreach 循环。我想知道 哪个性能更好? 选择循环的标准是什么? 当我们在另一个循环中循环时应该使用哪个? 我一直想知道要
我在高中的编程课上,我的作业是制作一个基本的小计和顶级计算器,但我在一家餐馆工作,所以制作一个只能让你在一种食物中读到。因此,我尝试让它能够接收多种食品并将它们添加到一个价格变量中。抱歉,如果某些代码
这是我正在学习的一本教科书。 var ingredients = ["eggs", "milk", "flour", "sugar", "baking soda", "baking powder",
我正在从字符串中提取数字并将其传递给函数。我想给它加 1,然后返回字符串,同时保留前导零。我可以使用 while 循环来完成此操作,但不能使用 for 循环。 for 循环只是跳过零。 var add
编辑:我已经在程序的输出中进行了编辑。 该程序要求估计给定值 mu。用户给出一个值 mu,同时还提供了四个不等于 1 的不同数字(称为 w、x、y、z)。然后,程序尝试使用 de Jaeger 公式找
我正在编写一个算法,该算法对一个整数数组从末尾到开头执行一个大循环,其中包含一个 if 条件。第一次条件为假时,循环可以终止。 因此,对于 for 循环,如果条件为假,它会继续迭代并进行简单的变量更改
现在我已经习惯了在内存非常有限的情况下进行编程,但我没有答案的一个问题是:哪个内存效率更高;- for(;;) 或 while() ?还是它们可以平等互换?如果有的话,还要对效率问题发表评论! 最佳答
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 8 年前。 我正在尝试创建一个小程序,我可以在其中读取该程序的单词。如果单词有 6
这个问题在这里已经有了答案: python : list index out of range error while iteratively popping elements (12 个答案) 关
我正在尝试向用户请求 4 到 10 之间的整数。如果他们回答超出该范围,它将进入循环。当用户第一次正确输入数字时,它不会中断并继续执行 else 语句。如果用户在 else 语句中正确输入数字,它将正
我尝试创建一个带有嵌套 foreach 循环的列表。第一个循环是循环一些数字,第二个循环是循环日期。我想给一个日期写一个数字。所以还有另一个功能来检查它。但结果是数字多次写入日期。 Out 是这样的:
我想要做的事情是使用循环创建一个数组,然后在另一个类中调用该数组,这不会做,也可能永远不会做。解决这个问题最好的方法是什么?我已经寻找了所有解决方案,但它们无法编译。感谢您的帮助。 import ja
我尝试创建一个带有嵌套 foreach 循环的列表。第一个循环是循环一些数字,第二个循环是循环日期。我想给一个日期写一个数字。所以还有另一个功能来检查它。但结果是数字多次写入日期。 Out 是这样的:
我正在模拟一家快餐店三个多小时。这三个小时分为 18 个间隔,每个间隔 600 秒。每个间隔都会输出有关这 600 秒内发生的情况的统计信息。 我原来的结构是这样的: int i; for (i=0;
这个问题已经有答案了: IE8 for...in enumerator (3 个回答) How do I check if an object has a specific property in J
哪个对性能更好?这可能与其他编程语言不一致,所以如果它们不同,或者如果你能用你对特定语言的知识回答我的问题,请解释。 我将使用 c++ 作为示例,但我想知道它在 java、c 或任何其他主流语言中的工
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
我是 C 编程和编写代码的新手,以确定 M 测试用例的质因数分解。如果我一次只扫描一次,该功能本身就可以工作,但是当我尝试执行 M 次时却惨遭失败。 我不知道为什么 scanf() 循环有问题。 in
这个问题已经有答案了: JavaScript by reference vs. by value [duplicate] (4 个回答) 已关闭 3 年前。 我在使用 TSlint 时遇到问题,并且理
我尝试在下面的代码中添加 foreach 或 for 循环,以便为 Charts.js 创建多个数据集。这将允许我在此折线图上创建多条线。 我有一个 PHP 对象,我可以对其进行编码以稍后填充变量,但
我是一名优秀的程序员,十分优秀!