linux - 调用 mlockall() 后在同一地址重复发生小页面错误-6ren

linux - 调用 mlockall() 后在同一地址重复发生小页面错误

转载作者：塔克拉玛干更新时间：2023-11-02 23:09:16

25

4

问题

在尝试减少/消除应用程序中轻微页面错误的过程中，我发现了一个令人困惑的现象；也就是说，即使我认为我已经采取了足够的措施来防止页面错误，但我反复触发写入同一地址的小页面错误。

背景

根据建议here ，我调用了 mlockall 将所有当前和 future 的页面锁定到内存中。

在我最初的用例(涉及一个相当大的数组)中，我还按照建议 here 写入每个元素(或至少写入每个页面)来预先对数据进行故障处理。 ;尽管我意识到那里的建议是针对运行带有 RT 补丁的内核的用户，但强制写入以阻止 COW/请求分页的一般想法应该仍然适用。

我原以为 mlockall 可以用来防止轻微的页面错误。虽然手册页似乎只保证不会出现重大错误，但各种其他资源(例如上面)指出它也可用于防止轻微页面错误。

内核文档似乎也表明了这一点。例如，unevictable-lru.txt和 pagemap.txt声明 mlock() 的页面是不可回收的，因此不适合回收。

尽管如此，我还是继续触发了几个小的页面错误。

例子

我创建了一个极其精简的示例来说明问题:

#include <sys/mman.h> // mlockall
#include <stdlib.h> // abort

int main(int , char **) {
  int x;

  if (mlockall(MCL_CURRENT | MCL_FUTURE)) abort();

  while (true) {
    asm volatile("" ::: "memory"); // So GCC won't optimize out the write
    x = 0x42;
  }
  return 0;
}

这里我重复写同一个地址。很容易看出(例如通过 cat/proc/[pid]/status | awk '{print $10}')我在初始化完成后很长时间内仍然存在轻微的页面错误。

运行 systemtap-doc 中包含的 pfaults.stp 脚本的修改版本*，我记录了每个页面错误的时间、触发错误的地址、触发故障的指令，是否是主要/次要，以及读/写。在启动和 mlockall 的初始错误之后，所有错误都是相同的:尝试写入 x 触发了一个小的写入错误。

连续页面错误之间的间隔显示出一种引人注目的模式。对于一次特定的运行，间隔以秒为单位:2, 4, 4, 4.8, 8.16, 13.87, 23.588, 40.104, 60, 60, 60, 60, 60, 60, 60, 60, 60, ...这似乎是(大约)指数回退，绝对上限为 1 分钟。

在独立的 CPU 上运行它没有影响；以更高的优先级运行也没有。但是，以实时优先级运行会消除页面错误。

问题

这种行为是预期的吗？
1a.如何解释时间安排？
是否有可能避免这种情况？

版本

我正在运行 Ubuntu 14.04，内核 3.13.0-24-generic 和 Systemtap 版本 2.3/0.156，Debian 版本 2.3-1ubuntu1 (trusty)。使用 gcc-4.8 编译的代码没有额外的标志，尽管优化级别似乎并不重要(前提是 asm volatile 指令保留在原位；否则写入得到优化完全退出)

我很乐意提供更多详细信息(例如确切的 stap 脚本、原始输出等)，如果它们被证明是相关的话。

*实际上，vm.pagefault 探测器因我的内核和 systemtap 组合而被破坏，因为它引用了一个不再存在于内核的 handle_mm_fault 函数中的变量，但是修复是微不足道的)

最佳答案

@fche 提到了 Transparent Huge Pages让我走上正轨。

粗心阅读我在问题中链接到的内核文档表明 mlock 确实不会阻止内核将页面迁移到新的页面框架；事实上，有一整节专门讨论 migrating mlocked pages .因此，简单地调用 mlock() 并不能保证您不会遇到任何轻微的页面错误

有点迟了，我看到了this answer引用相同的段落并部分回答了我的问题。

内核可能移动页面的原因之一是 memory compaction ，由此内核释放了一个大的连续页面 block ，因此可以分配一个“大页面”。可以轻松禁用透明大页面；参见例如this answer .

我的特定测试用例是在 3.13 kernel 中引入的一些 NUMA 平衡变化的结果。 .

引用LWN article linked therein :

The scheduler will periodically scan through each process's address space, revoking all access permissions to the pages that are currently resident in RAM. The next time the affected process tries to access that memory, a page fault will result. The scheduler will trap that fault and restore access to the page in question...

可以通过将进程的 NUMA 策略设置为显式使用某个节点来禁用调度程序的这种行为。这可以通过在命令行中使用 numactl(例如 numactl --membind=0)或调用 libnuma 库来完成。

编辑 sysctl documentation关于 NUMA 平衡的明确说明:

If the target workload is already bound to NUMA nodes then this feature should be disabled.

这可以通过 sysctl -w kernel.numa_balancing=0

来完成

页面迁移可能还有其他原因，但这足以满足我的目的。

关于linux - 调用 mlockall() 后在同一地址重复发生小页面错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24007329/

25

4

0

文章推荐： linux - CKAN 权限在 apache2.4.7 数据推送器中被拒绝

文章推荐： c++ - 获取文件上次修改时间并进行比较

文章推荐： c++ - 声明函数静态和后来的非静态 : is it standard?

文章推荐： linux - 多播流量因 virtualbox host only 网络而失败

javascript - 在父选项卡(页面)上显示叠加层，直到打开其所有子选项卡(页面)
假设我有父页面。当我单击“打印”时，会打开一个新选项卡(页面)以进行打印预览。我想要的是，当我单击“打印”时，父选项卡(页面)上应显示覆盖层，以停止进一步的工作，直到子选项卡关闭。 Because
javascript - 如何从 HTTPS 页面 POST 数据到 HTTP 页面
我知道这是不可能的，但我想我还是会问这个问题。我有一个 HTTPS 页面，并且正在动态创建一个表单。我想将表单发布到 HTTP 页面。在浏览器不弹出警告的情况下这可能吗？当我在 IE8 上执行此操作
javascript - 将 .aspx 页面 html 渲染/调用到另一个 .aspx 页面
在我的应用程序中，我实现了ajax 4.0客户端模板目前我的模板位于同一个.aspx页面上。 (例如 Main.aspx) 但我想将它们外部化。(即所有 HTML 都会放在另一个页面上) 为此，我使
javascript - 锁定/卡住导航栏/整个 html 页面，直到加载其他 html 页面
我目前正在构建自己的网络应用程序。在此应用程序的标题中有一个导航栏。我将相同的导航栏添加到我的所有 html 页面，以便在页面之间导航时保持可见，并将导航元素设置为事件到我现在所在的页面。我的
iis-7 - Windows 身份验证不适用于经典 ASP 页面(但适用于同一站点中的 ASP.Net 页面)
我们有一个在集成管道下运行的 IIS7 Intranet 站点，该管道主要是 ASP.Net，带有一些传统的经典 ASP 页面。该站点允许匿名访问大多数区域，但使用 Windows 身份验证来保护某些
c# - 如何将长 HTML 文件拆分为单独的相互链接的页面，例如页面 1、页面 2、页面 3
有一个要求，我需要根据 div 标签的高度超过 700 像素的条件将大型 HTML 页面拆分为多个页面。我还可以根据字数拆分页面。下面的示例根据 HTML 标签分割页面，而我需要根据 div 高度
html - 如何在不使用 jquery 的情况下在另一个 html 页面 div 中显示 html 页面
有两个 html 页面，如果在第一个页面中单击特定图像，它将转到第二个 html 页面。如果在第二个 html 页面上的任何地方单击它应该返回到第一页并将第二页完全显示在第一页的一个 div 中 1s
haskell - Servant 中的 Html 页面——如何结合 REST API 和静态 html 页面？
我有一个简单的 hello world Servant 应用程序。我需要向它添加一些静态或动态的 html 页面。我怎样才能做到这一点？在文档中没有提到它。注意我不想在 Haskell 代码中创建 h
javascript - jQuery 将外部 html 页面 <title> 插入另一个 html 页面
我有两个文件 index.html 和 index2.html。这两个文件都在本地机器上的同一目录中(无法访问 PHP 等)。我正在努力 Page Title 使用 jQuery 从 index.h
java - 为一个 Servlet 创建一个动态前端 JSP 页面，同时将 Servlet 的输出显示到 JSP 页面
假设我有一个 JSP 页面 index.jsp User id:
javascript - 页面 A 将值发布到页面 B，页面 B 使用 cURL 向页面 C 发送另一个帖子，并将响应返回到页面 A
我面临着一个对我来说非常陌生的情况。我会尽力让事情变得简单来解释它一步一步来。 1)在页面 A(用户表单)中，我从字段中获取一些值并将其作为 jQuery AJAX POST 发送到页面 B。这是主要
javascript - JQuery 函数点击 html 页面 1 上的按钮，影响 html 页面 2 的列
我正在尝试弄清楚如何从 buttons.html 获取用户按钮点击动态切换第二个列的可见性 userinput.html 。我正在使用 DataTables userinput.html表并认为我有
asp.net-mvc - angularjs 仅带有 cshtml 页面，而不是带有 web api 2 的 html 页面
我有asp。净 mvc4 项目。 Angularjs 已集成。我已经按照以前的要求构建了 HTML 页面和 WEB API 2。现在出于某种原因，我必须使用 CSHTML 页面。以前我只有 web
WordPress 页面 - 未找到页面
我的网站包含大约 18 个不同的页面。以管理员身份登录后，我单击“页面”。我看到了以下内容 All (20) | Mine (19) | Published (19) | Draft (1) No
Haskell "man"页面？
Haskell 中每个函数都有手册页吗？换句话说，我可以在某处输入 man fst 并获取有关该函数的手册或帮助页面吗？我发现大量的功能势不可挡! 我正在使用 GHC 和 GHCi。最佳答案我不知
Github 页面 - 禁用除单个站点之外的所有站点的自定义域重定向？
我一直在用github pages很长一段时间以来，并使用自定义域重定向功能来重定向我的 user website来自 prahladyeri.github.io到我自己的域名 https://www
显示旧代码的 Github 页面
我对 Github 有一个基本的了解:我知道如何创建、添加、提交、推送和克隆存储库。我也开始探索 Github 页面来托管我的项目。我的最新项目于 3 月开始并将其推送到 gh-page。从那以后，我
Airflow Ooops 页面
在尝试查看日志时，Airflow 会抛出一个带有以下消息的 oops 页面: File "/Users/user/.pyenv/versions/3.5.2/lib/python3.5/locale.
GitHub 页面 - 网址重写支持
我已经按照此处列出的步骤 (https://pages.github.com/) 为我正在处理的网站设置了一个 GitHub 页面我设置的站点当前托管在 IIS 下，并使用 URL Rewrite
将域重定向到 Openshift 页面
我想将我的 domain.com 重定向到 openshift 页面 (openshift-app.rhcloud.com)。我已经按照描述完成了 here它有效。唯一的问题是，在任何网站上，我都不会

首页

博学

6Ren·AI

商城

linux - 调用 mlockall() 后在同一地址重复发生小页面错误

问题

背景

例子

问题

版本