c++ - mmap 与使用 new 分配的内存-6ren

c++ - mmap 与使用 new 分配的内存

转载作者：太空狗更新时间：2023-10-29 21:22:05

40

4

我有一个 BitVector 类，它可以使用 new 动态分配内存，也可以 mmap 一个文件。将它用于小文件时，性能没有明显差异，但当使用 16GB 文件时，我发现 mmap 文件比使用 new 分配的内存慢得多。 (大约慢 10 倍或更多。)请注意，我的机器有 64GB 的 RAM。

有问题的代码是从一个大磁盘文件中加载值并将它们放入布隆过滤器中，该过滤器使用我的 BitVector 类进行存储。

起初我认为这可能是因为 mmap 文件的支持与我从中加载的文件位于同一磁盘上，但这似乎不是问题所在。我把这两个文件放在两个物理上不同的磁盘上，性能没有变化。 (虽然我相信他们在同一个 Controller 上。)

然后，我使用 mlock 尝试将所有内容强制放入 RAM，但 mmap 实现仍然非常慢。

所以，暂时我只是直接分配内存。我在此比较的代码中唯一要更改的是标记 BitVector 构造函数。

请注意，为了衡量性能，我同时查看了 top 和每秒可以添加到 Bloom 过滤器中的状态数。使用 mmap 时，CPU 使用率甚至没有在 top 上注册 - 尽管 jbd2/sda1-8 开始上升(我正在运行在 Ubuntu 服务器上)，它看起来是一个处理驱动器日志记录的进程。输入和输出文件存储在两个硬盘上。

谁能解释这种巨大的性能差异？

谢谢!

最佳答案

首先，mmap 是一个系统调用或接口(interface)，用于访问系统的虚拟内存。
现在，在 linux 中(我希望你在 *nix 上工作)通过延迟加载或更常见的Copy-On-Write。

对于 mmap 也是如此，实现了这种延迟加载。

发生的情况是，当您在文件上调用 mmap 时，内核不会立即为要映射的文件分配主内存页面。
相反，它会等待程序从虚幻页面写入/读取，在哪个阶段，发生页面错误，然后相应的中断处理程序将实际加载可以保存在该页面框架中的特定文件部分(同时更新页面表，因此下次，当你读/写同一页时，它指向一个有效的框架)。

现在，您可以使用带有 mmap 等的 mlock、madvise、MAP_POPULATE 标志来控制此行为。
MAP_POPULATE 带有 mmap 标志，告诉内核在调用返回之前将文件映射到内存页面，而不是每次访问新页面时都出现页面错误。因此，在加载文件之前，函数将是阻止。

从手册页:

MAP_POPULATE (since Linux 2.5.46)              Populate (prefault) page tables for a mapping.  For a file              mapping, this causes read-ahead on the file.  Later accesses              to the mapping will not be blocked by page faults.              MAP_POPULATE is supported for private mappings only since              Linux 2.6.23.

关于c++ - mmap 与使用 new 分配的内存，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21375269/

40

4

0

文章推荐： Python:未检测到已安装的 Selenium 包

文章推荐： c# - 使用双重检查锁定的内存读取可见性排序与写入顺序

文章推荐： HTTP 响应代码的 Python 异常

文章推荐： c# - 更新 zip 时出现内存不足异常

javascript - (new { htmlAtributes = new { }) 和 (new { }) 有什么区别
我知道它们是匿名类型，但我不明白 Razor 语法。在一些文档中，我找到了这样的示例: @Html.Label("Hello", new { htmlAtributes = new { id = "h
new Object([])/new Object(new Array()) 的 JavaScript 构造函数
关于:new Object(new Array()) 有一个相当基本的问题，我自己确实无法给出答案，我正在寻求建议: 在js中实例化对象时使用如下方法: var obj = new Object();
eclipse - "New Folder"、 "New Source Folder"和 "New Package"之间的区别？
在eclipse中右击项目时，“新建文件夹”、“新建源文件夹”和“新建包”有什么区别？他们似乎都在做同样的事情，引用文献并没有说太多。谢谢最佳答案新建文件夹在项目中创建一个新文件夹。新建源文
bolt-cms - New page、New entry 和 New Showcase 的区别
几天来我一直在测试 bolt-cms，我试图了解它是如何工作的。我想知道新页面、新条目和新展示柜之间有什么区别。我已阅读 this它并没有填补空白。最佳答案 Pages、Entries 和 Sh
java - new LinkedList<>(new LinkedList<>()) 和 new LinkedList...的区别，添加
更新:感谢所有的回答。我发现的最干净的解决方案是这个: if ( k(Arrays.asList(new LinkedList<>())); 我有一个递归方法，可以从列表中生成所有“n 选 k”组合。
C++ new/new[]，它是如何分配内存的？
我现在想知道这些指令是如何分配内存的。例如，如果我得到代码怎么办: x = new int[5]; y = new int[5]; 如果分配了这些，它在 RAM 中的实际情况如何？是为每个变量保留整
java - new PrintWriter(new BufferedWriter(new FileWriter ("output.txt", true))) 不打印
我希望将其写入output.txt而不清除它 - 只是附加到末尾。但是，当我使用以下两种方法时: public void addEmails(ArrayList emails){ for (i
c++ - operator new(n) 与 new unsigned char[n] 用于放置 new
我正在分配内存，稍后将用于构造具有放置 new 的对象。我应该使用 operator new(n)，还是应该使用 new unsigned char[n]？为什么？最佳答案因素: new[] 必须
c++ - new T() 等价于 `mem = operator new(sizeof(T)); new(mem)T` 吗？
基本上，我的问题是以下代码是否有效。 void* mem = operator new(sizeof(T)); T* instance = new(mem) T; delete instance; 如
c# - new Thread(void Target()) 和 new Thread(new ThreadStart(void Target())) 有什么区别？
很抱歉，如果之前有人问过这个问题，但我想就以下两种用法之间的区别提供一个简明的答案。 VS 似乎将它们都接受为有效代码。 private static void doSomeWork() { /
javascript - 无法理解Javascript new Array( new Array(5,4,3,2,1,0),new Array())
请告诉我这段代码在做什么，它是否创建多维数组(我认为不是)？代码片段.. var hanoi_peg = new Array( new Array( 5, 4, 3, 2, 1,
java - Java 中 new String ("X") 和 new String ("X") + new String ("Y") 之间字符串初始化的区别
这个问题在这里已经有了答案: String intern() behaviour (4 个答案) When should we use intern method of String on Stri
javascript - 为什么使用 {} 而不是 new Object() 并使用 [] 而不是 new Array() 和 true/false 而不是 new Boolean()？
许多人说您应该避免使用 new Object、new Array()，而是使用 {}。 [] 和真/假。使用字面量构造来获取对象或数组的新实例而不是使用 new 有什么好处？我知道 Crockfor
c++ - 避免由 new(new[]) 引起的内存泄漏
我正在开发一个存在内存泄漏的开源库。该库是围绕 boost::asio 构建的数据流服务。服务器端使用堆内存管理系统，该系统提供内存以容纳有限数量的 samples，同时它们等待通过 tcp 连接被推
c++ - 内存通过 new[] 泄漏而无需调用 new
我从以下函数中得到内存泄漏: int ReadWrite(int socket, char *readfile) { FILE *rf = NULL; rf = fopen(readfile,
c++ - new 的内存是否必须来自 operator new？
在考虑类似的事情时 auto x = new T; 标准是否强制要求内存必须来自operator new——类特定的还是全局的？也就是说，如果缺少特定于类的 operator new，则没有办法从除全
c++ - 创建对象 : A. new 还是 new A？
只是出于好奇:为什么 C++ 选择 a = new A 而不是 a = A.new 作为实例化对象的方式？后者不是更像是面向对象的吗？最佳答案 Just out of curiosity: Why
c++ - new 或 new[] 运算符
考虑以下代码: typedef SomeType type_t[2]; SomeType * arr1 = new type_t; //new or new[] ??? type_t * arr2
c++ - "new"运算符和 "new"函数之间的区别
这个问题在这里已经有了答案: Difference between 'new operator' and 'operator new'? (8 个答案) 关闭 8 年前。面试题:"new"运算符和
安卓用户界面 : New activity or new layout?
我正在为一个应用程序设计界面，以在 TableLayout 中显示从数据库中提取的一些数据。现在，默认 View 是纵向的，它由一个下拉菜单和一个三列的表格组成。当用户切换到横向时，微调器及其选项可以

首页

博学

6Ren·AI

商城

c++ - mmap 与使用 new 分配的内存