- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个网络应用程序,它将可预测的65k块分配为IO子系统的一部分。内存使用情况是在系统内自动跟踪的,因此我知道我实际使用了多少内存。也可以根据malloc_stats()检查此数字malloc_stats()
的结果
Arena 0:
system bytes = 1617920
in use bytes = 1007840
Arena 1:
system bytes = 2391826432
in use bytes = 247265696
Arena 2:
system bytes = 2696175616
in use bytes = 279997648
Arena 3:
system bytes = 6180864
in use bytes = 6113920
Arena 4:
system bytes = 16199680
in use bytes = 699552
Arena 5:
system bytes = 22151168
in use bytes = 899440
Arena 6:
system bytes = 8765440
in use bytes = 910736
Arena 7:
system bytes = 16445440
in use bytes = 11785872
Total (incl. mmap):
system bytes = 935473152
in use bytes = 619758592
max mmap regions = 32
max mmap bytes = 72957952
total in use bytes
是完全正确的数字。但是,该应用程序的RES(从顶部/顶部)为5.2GB。分配几乎总是65k;我不明白在mmap发挥作用时,我看到的更多碎片/废料甚至更多。
total system bytes
不等于每个竞技场中
system bytes
的总和。
mallinfo
并重新运行测试-捕获此应用时,该应用程序不再处理任何内容。没有连接网络。它是空闲的。
Arena 2:
system bytes = 2548473856
in use bytes = 3088112
Arena 3:
system bytes = 3288600576
in use bytes = 6706544
Arena 4:
system bytes = 16183296
in use bytes = 914672
Arena 5:
system bytes = 24027136
in use bytes = 911760
Arena 6:
system bytes = 15110144
in use bytes = 643168
Arena 7:
system bytes = 16621568
in use bytes = 11968016
Total (incl. mmap):
system bytes = 1688858624
in use bytes = 98154448
max mmap regions = 32
max mmap bytes = 73338880
arena (total amount of memory allocated other than mmap) = 1617780736
ordblks (number of ordinary non-fastbin free blocks) = 1854
smblks (number of fastbin free blocks) = 21
hblks (number of blocks currently allocated using mmap) = 31
hblkhd (number of bytes in blocks currently allocated using mmap) = 71077888
usmblks (highwater mark for allocated space) = 0
fsmblks (total number of bytes in fastbin free blocks) = 1280
uordblks (total number of bytes used by in-use allocations) = 27076560
fordblks (total number of bytes in free blocks) = 1590704176
keepcost (total amount of releaseable free space at the top of the heap) = 439216
total system bytes
报告的
malloc
之间的差异远小于每个
arena
报告的数额。 (1.6Gb vs 6.1GB)这可能意味着(A)
malloc
实际上正在释放块,但竞技场却没有,或者(B)
malloc
根本没有压缩内存分配,并且正在创建大量的碎片。
最佳答案
完整的细节可能会有些复杂,因此我将尽量简化。另外,这是一个粗略的轮廓,并且在某些地方可能不准确。
从内核请求内存malloc
使用sbrk
或匿名mmap
向内核请求连续的内存区域。每个区域将是机器页面大小的倍数,通常为4096字节。这样的存储区域在malloc
术语中称为舞台。下面的更多内容。
这样映射的任何页面都将成为进程的虚拟地址空间的一部分。但是,即使已将它们映射到,它们也可能尚未由物理RAM页面备份。在R / O模式下,它们被[多对一]映射到单个“零”页面。
当进程尝试写入此类页面时,会引发保护错误,内核会中断到零页面的映射,分配实际的物理页面,然后重新映射到该页面,然后在故障点重新启动该过程。这次写入成功。这类似于到/从分页磁盘的按需分页。
换句话说,进程的虚拟地址空间中的页面映射与物理RAM页面/插槽中的页面驻留不同。稍后再详细介绍。
RSS(居民集大小)
RSS并不能真正衡量一个进程分配或释放多少内存,而是目前虚拟地址空间中有多少页在RAM中具有物理页。
如果系统的分页磁盘为128GB,但仅具有(例如)4GB RAM,则进程RSS永远不能超过4GB。进程的RSS根据其虚拟地址空间中的页面调入或调出页面而上升/下降。
因此,由于启动时页面映射为零,因此进程RSS可能比其从系统请求的虚拟内存量低得多。同样,如果另一个进程B从给定的进程A“窃取”一个页面槽,则A的RSS下降,B的上升。
进程“工作集”是内核必须为进程保留的最小页数,以基于某种“过分”的措施来防止进程因页面错误而过度获取物理内存页。每个操作系统对此都有自己的想法,并且通常是整个系统或每个进程的可调参数。
如果一个进程分配了一个3GB的阵列,但仅访问它的前10MB,则它的工作集要比随机/分散访问该阵列的所有部分时要低。
也就是说,如果RSS高于(或可以高于)工作集,则该过程将运行良好。如果RSS低于工作集,则该过程将出现过多的页面错误。这可能是因为它的“参考位置”较差,或者是由于系统中的其他事件合谋“窃取”了该进程的页面位置。
malloc和竞技场
为了减少碎片,malloc
使用了多个竞技场。每个竞技场都有一个“首选”分配大小(又称“块”大小)。也就是说,较小的请求(例如malloc(32)
)来自(例如)竞技场A,而较大的请求(例如malloc(1024 * 1024)
)来自不同的领域(例如)竞技场B。
这样可以防止小分配“烧录”竞技场B中最后一个可用块的前32个字节,从而使其太短而无法满足下一个malloc(1M)
当然,对于每个请求的大小,我们都不能有一个单独的区域,因此“首选”块大小通常为2的幂。
当为给定的块大小创建一个新的竞技场时,malloc
不仅会请求块大小的区域,而且还会请求其一部分倍数。这样做是为了可以快速满足相同大小的后续请求,而不必对每个请求都执行mmap
。由于最小大小为4096,因此竞技场A将具有4096/32个块或128个块。
免费和munmap
当应用程序执行free(ptr)
[ptr
代表块]时,该块被标记为可用。 free
可以选择合并当时空闲/不可用的连续块。
如果该块足够小,则它什么也不会做(即)该块可用于重新分配,但是free
不会尝试将块释放回内核。对于较大的分配,free
将[尝试]立即执行munmap
。munmap
可以取消映射单个页面[甚至是少量字节],即使它位于多页区域的中间。如果是这样,则应用程序现在在映射中有一个“洞”。
malloc_trim和madvise
如果调用free
,则可能会调用munmap
。如果未映射整个页面,则该过程的RSS(例如A)关闭。
但是,请考虑仍分配的块,或标记为可用/可用但未映射的块。
它们仍然是流程A的RSS的一部分。如果另一个进程(例如B)开始进行大量分配,则系统可能必须将某些进程A的插槽分页到分页盘上(减少A的RSS),以便为B腾出空间(其RSS上升)。
但是,如果没有进程B窃取A的页面槽,则进程A的RSS可以保持较高水平。假设进程A分配了100MB,前一阵子用了,但是现在只使用1MB,RSS仍为100MB。
那是因为没有进程B的“干扰”,内核没有理由从A窃取任何页面槽,因此它们“保留在RSS中”。
要告诉内核不太可能很快使用内存区域,我们需要带有madvise
的MADV_WONTNEED
syscall。这告诉内核内存区域的优先级较低,它应该[更多]积极地将其分页到分页磁盘,从而减少进程的RSS。
页面保持映射在进程的虚拟地址空间中,但被导出到分页磁盘。请记住,页面映射与页面驻留不同。
如果该进程再次访问该页面,则将导致页面错误,内核将把数据从页面磁盘拉到物理RAM插槽并重新映射。 RSS回去。古典需求分页。madvise
是malloc_trim
用于减少该过程的RSS的东西。
关于c - Malloc使用的内存是所需内存的10倍,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39753265/
我在具有 2CPU 和 3.75GB 内存 (https://aws.amazon.com/ec2/instance-types/) 的 c3.large Amazon EC2 ubuntu 机器上运
我想通过用户空间中的mmap-ing并将地址发送到内核空间从用户空间写入VGA内存(视频内存,而不是缓冲区),我将使用pfn remap将这些mmap-ed地址映射到vga内存(我将通过 lspci
在 Mathematica 中,如果你想让一个函数记住它的值,它在语法上是很轻松的。例如,这是标准示例 - 斐波那契: fib[1] = 1 fib[2] = 1 fib[n_]:= fib[n] =
我读到动态内存是在运行时在堆上分配的,而静态内存是在编译时在堆栈上分配的,因为编译器知道在编译时必须分配多少内存。 考虑以下代码: int n; cin>>n; int a[n]; 如果仅在运行期间读
我是 Python 的新手,但我之前还不知道这一点。我在 for 循环中有一个基本程序,它从站点请求数据并将其保存到文本文件但是当我检查我的任务管理器时,我发现内存使用量只增加了?长时间运行时,这对我
我正在设计一组数学函数并在 CPU 和 GPU(使用 CUDA)版本中实现它们。 其中一些函数基于查找表。大多数表占用 4KB,其中一些占用更多。基于查找表的函数接受一个输入,选择查找表的一两个条目,
读入一个文件,内存被动态分配给一个字符串,文件内容将被放置在这里。这是在函数内部完成的,字符串作为 char **str 传递。 使用 gdb 我发现在行 **(str+i) = fgetc(aFil
我需要证实一个理论。我正在学习 JSP/Java。 在查看了一个现有的应用程序(我没有写)之后,我注意到一些我认为导致我们的性能问题的东西。或者至少是其中的一部分。 它是这样工作的: 1)用户打开搜索
n我想使用memoization缓存某些昂贵操作的结果,这样就不会一遍又一遍地计算它们。 两个memoise和 R.cache适合我的需要。但是,我发现缓存在调用之间并不可靠。 这是一个演示我看到的问
我目前正在分析一些 javascript shell 代码。这是该脚本中的一行: function having() { memory = memory; setTimeout("F0
我有一种情况,我想一次查询数据库,然后再将整个数据缓存在内存中。 我得到了内存中 Elasticsearch 的建议,我用谷歌搜索了它是什么,以及如何在自己的 spring boot 应用程序中实现它
我正在研究 Project Euler (http://projecteuler.net/problem=14) 的第 14 题。我正在尝试使用内存功能,以便将给定数字的序列长度保存为部分结果。我正在
所以,我一直在做 Java 内存/注意力游戏作业。我还没有达到我想要的程度,它只完成了一半,但我确实让 GUI 大部分工作了......直到我尝试向我的框架添加单选按钮。我认为问题可能是因为我将 JF
我一直在尝试使用 Flask-Cache 的 memoize 功能来仅返回 statusTS() 的缓存结果,除非在另一个请求中满足特定条件,然后删除缓存。 但它并没有被删除,并且 Jinja 模板仍
我对如何使用 & 运算符来减少内存感到非常困惑。 我可以回答下面的问题吗? clase C{ function B(&$a){ $this->a = &$a; $thi
在编写代码时,我遇到了一个有趣的问题。 我有一个 PersonPOJO,其 name 作为其 String 成员之一及其 getter 和 setter class PersonPOJO { priv
在此代码中 public class Base { int length, breadth, height; Base(int l, int b, int h) { l
Definition Structure padding is the process of aligning data members of the structure in accordance
在 JavaScript Ninja 的 secret 中,作者提出了以下方案,用于在没有闭包的情况下内存函数结果。他们通过利用函数是对象这一事实并在函数上定义一个属性来存储过去调用函数的结果来实现这
我正在尝试找出 map 消耗的 RAM 量。所以,我做了以下事情;- Map cr = crPair.collectAsMap(); // 200+ entries System.out.printl
我是一名优秀的程序员,十分优秀!