- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
MongoDB 2.46 & 2.4.8
用例:
问题是在我开始将数据加载到服务器后不久出现的。我做了很多更新插入,一开始的表现非常棒(3000 - 4000 更新插入/秒)。这是预料之中的,因为工作集将能够适合内存。在 30.000.000 个文件之后,该过程似乎出现了很多页面错误,我不知道为什么。 数据文件约为。 33GB,性能约为 500 upserts/sec,有很多页面错误。那应该意味着工作集不在内存中。但是,256GB RAM 应该绰绰有余。我尝试了“touch”命令,但驻留内存很低(我什至重新启动了 mongod 进程,运行了 touch 命令,即使“mapped”和“vsize”飙升到很多 GB,驻留内存仍然很低,35m) .我尝试重新索引集合,瞧瞧,驻留内存从 35m -> 20GB。但是,我又一次看到了页面错误。然后我尝试 vmtouch 数据文件(或使用 dd)。同样,很多页面错误。
问题是我不能“只有”500 upserts/sec。我应该更改我的应用程序逻辑吗?我认为使用 256GB 内存我的“事件”工作集(预计 60GB)应该适合内存。我在中间(30GB),似乎我无法做任何事情来解决这个问题。是numa硬件吗?我应该进行任何其他更改吗?
提前致谢
最佳答案
我刚刚写了一个pretty detailed answer关于驻留内存、页面错误以及如何进行故障排除、调整和调整等的 ServerFault,所以我不会在这里重新散列。
我会说 Sammaye 的评论是正确的,touch(或 dd、vmtouch 等)命令不会导致内存被再次报告为常驻 mongod
进程,直到进程实际访问数据(在那之前它只是在 FS 缓存中),然后你可以在 SERVER-9415 中解决这个问题。这可能导致常驻内存报告不足。
我认为您已经在查看此处的关键指标,并且您应该能够实现比报告更高的驻留内存(或者至少,将更多数据放入内存而不会出现明显的页面错误)。您所描述的情况听起来像是来自其他地方的内存压力,但我假设您会注意到另一个进程占用了大量内存。
我要指出的是,我之前曾花费数天(字面意思)尝试使特定 AWS 实例超过 30% 的内存阈值,但没有成功。
当我们最终放弃并尝试另一个实例时,没有改变任何东西(我们只是添加了一个新实例作为辅助实例并故障转移到它)它立即占用了超过 70% 的常驻内存。当然,那是在 m2.4xlarge
实例上进行的,因此与您的实例规模不同,但始终值得牢记。如果您可以在另一个实例上尝试,我建议您试一试。
关于MongoDB、NUMA 硬件、页面错误但有足够的 RAM 用于工作集、touch 命令或 vmtouch/dd 未加载到内存中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19995756/
如果我们想访问数组的元素 i,我们会这样做:i *(每个元素的大小)+ 数组的起始地址 = 我们需要访问的元素的内存位置。然后 CPU 直接访问 RAM 中的该位置。这是怎么发生的? 假设我要定位的内
考虑以下 python 代码 with open(sys.argv[2], 'r') as fin, \ open(sys.argv[3], 'w') as fout:
基本上我在 Centos 6.2 16GB 系统上运行我的世界服务器 我通过 rtoolkit 引导来启动我的服务器,现在我分配它使用 12GB,但它使用的 muc 比这多,我不知道为什么。我运行此命
我正在开发一个小型 x86 内核。我正在访问并尝试读取 GRUB 在多重引导 header 中提供的内存映射。我有一个 Intel i3 cpu 和 4 GiB 的 RAM。在这台机器上运行时,我正在
我有 3 GB 内存。有没有办法只为 C++ 应用程序分配 512MB 的 RAM? 否则 有没有办法暂时将我的 RAM 减少到 512MB 以进行测试? 谢谢,阿肖克 最佳答案 使用SetProce
我的一个 friend 告诉我,在 x86 架构上,DMA Controller 无法在两个不同的 RAM 位置之间传输。它只能在RAM和外设(如PCI总线)之间传输。 这是真的吗? 因为 AFAIK
做一些分析(内存和速度) 我一直被 win7 似乎分配的 RAM 正好是我要求的两倍这一事实所困扰...注意这是我第一次在 win7 上进行这样的主动分析,所以我真的不知道会发生什么。 我在 win7
我经常玩 retrofit 版的 Minecraft。这样做的一个缺点是,每当我启动 Minecraft 时,编译所有模组都需要花费大量时间。这可能需要大约 15 分钟左右的时间,在我看来,这太长了。
我想编写一个内核模块,可以通过 DMA 将数据从 RAM 传输到 RAM。有一些帖子讨论这个,但我真的不明白。有人说可能,也有人说不可能。 如果我对 ldd3 的理解是正确的,RAM 到 RAM 的复
我正在寻找一种方法来查找总内存和正在使用的内存的单个熟值输出。 gwmi Win32_OperatingSystem | select TotalVisibleMemorySize, FreePhys
我在 Heroku 上有一个网络应用程序,我试图了解添加具有 1GB RAM 的 Memcached 实例与向我的 Postgres 服务器添加 1GB RAM 之间的区别/权衡。 如果我添加一个 M
在我的例子中,我有一个包含大约 6000 个实例化类的字典,其中每个类都有 1000 个属性变量,所有类型都是字符串或字符串列表。当我建立这本字典时,我的 RAM 变得非常高。有没有一种方法可以在将字
我的问题是:如果您用完了所有可用的视频内存,并尝试创建新纹理 (SDL),是否会自动使用普通内存而不是视频内存?或者,您是否必须尝试使用使用普通 ram 的表面 (SDL)?如果您出于任何原因无法
我在从 ram 地址获取值时遇到问题。 我有一些限制,即它必须是 C 代码,并且存储信息的地址由 u32 值给出,例如 0x001c0080。 环境是ARM的,我用的是eclipse sdk。我怎样才
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a software
我正在尝试使用 GCC 编译器(标准 C)编译裸机应用程序。我使用 Cyclone V SoC 和 Cortex-A9 处理器。 eclipse DS-5。我收到这些错误 - “Region ram
如果 RAM 不是问题(我的服务器上有接近 200GB),是逐行读取更快还是将所有内容读入 RAM 并访问它?每行将是大约 200-500 个 unicode 字符的字符串。每个文件有近 200 万行
我在我的两台机器上运行以下命令: import os, sqlite3 import pandas as pd from feat_transform import filter_anevexp db
我正在尝试在我的一个项目中引入一些 CUDA 优化。但我认为我在这里做错了什么。我想实现一个简单的矩阵 vector 乘法 (result = matrix * vector)。但是当我想将结果复制回
#include #include #include #include #include #include using namespace std; char randomLetter()
我是一名优秀的程序员,十分优秀!