- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个 BitVector
类,它可以使用 new
动态分配内存,也可以 mmap
一个文件。将它用于小文件时,性能没有明显差异,但当使用 16GB 文件时,我发现 mmap 文件比使用 new
分配的内存慢得多。 (大约慢 10 倍或更多。)请注意,我的机器有 64GB 的 RAM。
有问题的代码是从一个大磁盘文件中加载值并将它们放入布隆过滤器中,该过滤器使用我的 BitVector
类进行存储。
起初我认为这可能是因为 mmap 文件的支持与我从中加载的文件位于同一磁盘上,但这似乎不是问题所在。我把这两个文件放在两个物理上不同的磁盘上,性能没有变化。 (虽然我相信他们在同一个 Controller 上。)
然后,我使用 mlock
尝试将所有内容强制放入 RAM,但 mmap 实现仍然非常慢。
所以,暂时我只是直接分配内存。我在此比较的代码中唯一要更改的是标记 BitVector
构造函数。
请注意,为了衡量性能,我同时查看了 top
和每秒可以添加到 Bloom 过滤器中的状态数。使用 mmap
时,CPU 使用率甚至没有在 top
上注册 - 尽管 jbd2/sda1-8
开始上升(我正在运行在 Ubuntu 服务器上),它看起来是一个处理驱动器日志记录的进程。输入和输出文件存储在两个硬盘上。
谁能解释这种巨大的性能差异?
谢谢!
最佳答案
首先,mmap
是一个系统调用或接口(interface),用于访问系统的虚拟内存。
现在,在 linux 中(我希望你在 *nix 上工作)通过延迟加载或更常见的Copy-On-Write。
对于 mmap 也是如此,实现了这种延迟加载。
发生的情况是,当您在文件上调用 mmap 时,内核不会立即为要映射的文件分配主内存页面。
相反,它会等待程序从虚幻页面写入/读取,在哪个阶段,发生页面错误,然后相应的中断处理程序将实际加载可以保存在该页面框架中的特定文件部分(同时更新页面表,因此下次,当你读/写同一页时,它指向一个有效的框架)。
现在,您可以使用带有 mmap 等的 mlock
、madvise
、MAP_POPULATE
标志来控制此行为。MAP_POPULATE
带有 mmap 标志,告诉内核在调用返回之前将文件映射到内存页面,而不是每次访问新页面时都出现页面错误。因此,在加载文件之前,函数将是阻止。
从手册页:
MAP_POPULATE (since Linux 2.5.46) Populate (prefault) page tables for a mapping. For a file mapping, this causes read-ahead on the file. Later accesses to the mapping will not be blocked by page faults. MAP_POPULATE is supported for private mappings only since Linux 2.6.23.
关于c++ - mmap 与使用 new 分配的内存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21375269/
我知道它们是匿名类型,但我不明白 Razor 语法。在一些文档中,我找到了这样的示例: @Html.Label("Hello", new { htmlAtributes = new { id = "h
关于:new Object(new Array()) 有一个相当基本的问题,我自己确实无法给出答案,我正在寻求建议: 在js中实例化对象时使用如下方法: var obj = new Object();
在eclipse中右击项目时,“新建文件夹”、“新建源文件夹”和“新建包”有什么区别?他们似乎都在做同样的事情,引用文献并没有说太多。 谢谢 最佳答案 新建文件夹 在项目中创建一个新文件夹。 新建源文
几天来我一直在测试 bolt-cms,我试图了解它是如何工作的。 我想知道新页面、新条目和新展示柜之间有什么区别。 我已阅读 this它并没有填补空白。 最佳答案 Pages、Entries 和 Sh
更新:感谢所有的回答。我发现的最干净的解决方案是这个: if ( k(Arrays.asList(new LinkedList<>())); 我有一个递归方法,可以从列表中生成所有“n 选 k”组合。
我现在想知道这些指令是如何分配内存的。 例如,如果我得到代码怎么办: x = new int[5]; y = new int[5]; 如果分配了这些,它在 RAM 中的实际情况如何?是为每个变量保留整
我希望将其写入output.txt而不清除它 - 只是附加到末尾。但是,当我使用以下两种方法时: public void addEmails(ArrayList emails){ for (i
我正在分配内存,稍后将用于构造具有放置 new 的对象。我应该使用 operator new(n),还是应该使用 new unsigned char[n]?为什么? 最佳答案 因素: new[] 必须
基本上,我的问题是以下代码是否有效。 void* mem = operator new(sizeof(T)); T* instance = new(mem) T; delete instance; 如
很抱歉,如果之前有人问过这个问题,但我想就以下两种用法之间的区别提供一个简明的答案。 VS 似乎将它们都接受为有效代码。 private static void doSomeWork() { /
请告诉我这段代码在做什么,它是否创建多维数组(我认为不是)? 代码片段.. var hanoi_peg = new Array( new Array( 5, 4, 3, 2, 1,
这个问题在这里已经有了答案: String intern() behaviour (4 个答案) When should we use intern method of String on Stri
许多人说您应该避免使用 new Object、new Array(),而是使用 {}。 [] 和真/假。 使用字面量构造来获取对象或数组的新实例而不是使用 new 有什么好处?我知道 Crockfor
我正在开发一个存在内存泄漏的开源库。该库是围绕 boost::asio 构建的数据流服务。服务器端使用堆内存管理系统,该系统提供内存以容纳有限数量的 samples,同时它们等待通过 tcp 连接被推
我从以下函数中得到内存泄漏: int ReadWrite(int socket, char *readfile) { FILE *rf = NULL; rf = fopen(readfile,
在考虑类似的事情时 auto x = new T; 标准是否强制要求内存必须来自operator new——类特定的还是全局的?也就是说,如果缺少特定于类的 operator new,则没有办法从除全
只是出于好奇:为什么 C++ 选择 a = new A 而不是 a = A.new 作为实例化对象的方式?后者不是更像是面向对象的吗? 最佳答案 Just out of curiosity: Why
考虑以下代码: typedef SomeType type_t[2]; SomeType * arr1 = new type_t; //new or new[] ??? type_t * arr2
这个问题在这里已经有了答案: Difference between 'new operator' and 'operator new'? (8 个答案) 关闭 8 年前。 面试题:"new"运算符和
我正在为一个应用程序设计界面,以在 TableLayout 中显示从数据库中提取的一些数据。现在,默认 View 是纵向的,它由一个下拉菜单和一个三列的表格组成。当用户切换到横向时,微调器及其选项可以
我是一名优秀的程序员,十分优秀!