- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
在尝试减少/消除应用程序中轻微页面错误的过程中,我发现了一个令人困惑的现象;也就是说,即使我认为我已经采取了足够的措施来防止页面错误,但我反复触发写入同一地址的小页面错误。
根据建议here ,我调用了 mlockall
将所有当前和 future 的页面锁定到内存中。
在我最初的用例(涉及一个相当大的数组)中,我还按照建议 here 写入每个元素(或至少写入每个页面)来预先对数据进行故障处理。 ;尽管我意识到那里的建议是针对运行带有 RT 补丁的内核的用户,但强制写入以阻止 COW/请求分页的一般想法应该仍然适用。
我原以为 mlockall
可以用来防止轻微的页面错误。虽然手册页似乎只保证不会出现重大错误,但各种其他资源(例如上面)指出它也可用于防止轻微页面错误。
内核文档似乎也表明了这一点。例如,unevictable-lru.txt和 pagemap.txt声明 mlock()
的页面是不可回收的,因此不适合回收。
尽管如此,我还是继续触发了几个小的页面错误。
我创建了一个极其精简的示例来说明问题:
#include <sys/mman.h> // mlockall
#include <stdlib.h> // abort
int main(int , char **) {
int x;
if (mlockall(MCL_CURRENT | MCL_FUTURE)) abort();
while (true) {
asm volatile("" ::: "memory"); // So GCC won't optimize out the write
x = 0x42;
}
return 0;
}
这里我重复写同一个地址。很容易看出(例如通过 cat/proc/[pid]/status | awk '{print $10}'
)我在初始化完成后很长时间内仍然存在轻微的页面错误。
运行 systemtap-doc
中包含的 pfaults.stp
脚本的修改版本*,我记录了每个页面错误的时间、触发错误的地址、触发故障的指令,是否是主要/次要,以及读/写。在启动和 mlockall
的初始错误之后,所有错误都是相同的:尝试写入 x
触发了一个小的写入错误。
连续页面错误之间的间隔显示出一种引人注目的模式。对于一次特定的运行,间隔以秒为单位:2, 4, 4, 4.8, 8.16, 13.87, 23.588, 40.104, 60, 60, 60, 60, 60, 60, 60, 60, 60, ...
这似乎是(大约)指数回退,绝对上限为 1 分钟。
在独立的 CPU 上运行它没有影响;以更高的优先级运行也没有。但是,以实时优先级运行会消除页面错误。
我正在运行 Ubuntu 14.04,内核 3.13.0-24-generic
和 Systemtap 版本 2.3/0.156,Debian 版本 2.3-1ubuntu1 (trusty)
。使用 gcc-4.8
编译的代码没有额外的标志,尽管优化级别似乎并不重要(前提是 asm volatile
指令保留在原位;否则写入得到优化完全退出)
我很乐意提供更多详细信息(例如确切的 stap
脚本、原始输出等),如果它们被证明是相关的话。
*实际上,vm.pagefault
探测器因我的内核和 systemtap 组合而被破坏,因为它引用了一个不再存在于内核的 handle_mm_fault
函数中的变量,但是修复是微不足道的)
最佳答案
@fche 提到了 Transparent Huge Pages让我走上正轨。
粗心阅读我在问题中链接到的内核文档表明 mlock
确实不会阻止内核将页面迁移到新的页面框架;事实上,有一整节专门讨论 migrating mlocked pages .因此,简单地调用 mlock()
并不能保证您不会遇到任何轻微的页面错误
有点迟了,我看到了this answer引用相同的段落并部分回答了我的问题。
内核可能移动页面的原因之一是 memory compaction ,由此内核释放了一个大的连续页面 block ,因此可以分配一个“大页面”。可以轻松禁用透明大页面;参见例如this answer .
我的特定测试用例是在 3.13 kernel 中引入的一些 NUMA 平衡变化的结果。 .
引用LWN article linked therein :
The scheduler will periodically scan through each process's address space, revoking all access permissions to the pages that are currently resident in RAM. The next time the affected process tries to access that memory, a page fault will result. The scheduler will trap that fault and restore access to the page in question...
可以通过将进程的 NUMA 策略设置为显式使用某个节点来禁用调度程序的这种行为。这可以通过在命令行中使用 numactl
(例如 numactl --membind=0
)或调用 libnuma
库来完成。
编辑 sysctl documentation关于 NUMA 平衡的明确说明:
If the target workload is already bound to NUMA nodes then this feature should be disabled.
这可以通过 sysctl -w kernel.numa_balancing=0
页面迁移可能还有其他原因,但这足以满足我的目的。
关于linux - 调用 mlockall() 后在同一地址重复发生小页面错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24007329/
下面的代码旨在在首次打开工作簿时运行。 Sub Auto_Open() Dim LastRow As Integer LastRow = Sheet6.UsedRange.Rows.Count Act
当我尝试操作我的代码时,除了弹出调试错误外,它执行得很好。错误信息在这里。 我的完整代码在这里。 #include using namespace std; class String { publi
The invocation of the constructor on type 'WpfApplication1.MainWindow' that matches the specified bi
我正在使用 BaseAdapter: public class MyAdapter extends BaseAdapter{ private final LayoutInflater mInflate
我想做网页抓取。我写了代码 var connection = require('./mysqlConnection'); var c = new Crawler({ maxConnections
我的系统中发生 Java 堆空间错误。我尝试了很多来自 Stack Overflow 的解决方案,但没有任何效果。当我工作时 当按下 OK 然后 (我的项目没有错误) 我的 eclipse.ini 是
环境: i5 750 DDR3 4GWin7 专业版 x64 sp1 DXSDK 9.0c 2010 年 6 月 GeForce GT240(驱动程序 275.33)512MB MSVC 2008 s
这段代码是我写的。 import socket host = 'localhost' port = 3794 s = socket.socket(socket.AF_INET, socket.SOCK
我正在尝试引用 UTC 时间间隔获取本地日期时间,我正在执行下面的代码。 var dtString =DateTime.UtcNow.ToString(@"yyyy-MM-ddTHH\:mm\:ss
我有一个非常简单的 C# 问题,它从库中加载 Windows WPF 窗口。这是代码: public partial class App : Application { public App(
我目前正在使用带有导航组件的底部导航,它工作正常但是当我们点击导航项 fragment 正在加载然后闪烁正在发生,即使当前选择的项目也会发生闪烁。它在加载 fragment 时发生。我的应用程序屏幕背
我是新来的 kotlin , 当我开始 Null Safety 时,我对下面的情况感到困惑. There's some data inconsistency with regard to initia
我有一个框,其中包含同时发生的两个独立的 css 转换。 当转换发生时,图标下方的标题和段落文本移动位置 参见 JS Fiddle:http://jsfiddle.net/Lsnbpt8r/ 这是我的
在为黑莓 10 构建电话间隙应用程序时,我遇到了异常情况。 [BUILD] Populating application source [BUILD] Parsing config.xml [
这个问题在这里已经有了答案: How to properly stop the Thread in Java? (8 个回答) 3年前关闭。 我看过How to properly stop the T
我试图弄清楚发生 fatal error 时如何刷新页面。基本上我正在访问图像 api 并将图像复制到我的服务器。我还每次都创建照片的缩略图版本。我会每隔一段时间收到一条错误消息,指出我的脚本试图分配
我正在尝试使用断言函数检查元素是否在屏幕上。我在我的测试应用程序 (AndroidDriver) 中使用 Appium 和 Java。我期望的是,如果元素在屏幕上,则返回 1;如果不在屏幕上,则返回
我正在开发图像上传系统。我使用 CommonsMultipartResolver 设置 maxUploadSize。当我尝试上传超过最大尺寸的图像文件时,会发生 MaxUploadSizeExcced
我有以下代码和@ComponentScan(basePackages = "com.project.shopping"),包结构为 com.project.shopping.Controller co
我尝试运行此程序作为测试,但收到错误“发生了 JNI 错误,请检查您的安装并重试”,然后是“发生了 Java 异常”。关于如何解决这个问题有什么想法吗? package java; public cl
我是一名优秀的程序员,十分优秀!