r - `Rprof`的内存分析输出的解释-6ren

r - `Rprof`的内存分析输出的解释

转载作者：行者123 更新时间：2023-12-04 04:24:06

29

4

我正在尝试使用分析来查看我的代码的哪一部分负责 3GB 的最大内存使用量(如 gc() 报告的最大已用内存统计数据， see here how )。我正在运行这样的内存分析:

Rprof(line.profiling = TRUE, memory.profiling = TRUE)
graf(...) # ... here I run the profiled code
Rprof(NULL)
summaryRprof(lines = "both", memory = "both")

输出如下:

$by.total
                       total.time total.pct mem.total self.time self.pct
"graf"                     299.12     99.69   50814.4      0.02     0.01
#2                         299.12     99.69   50814.4      0.00     0.00
"graf.fit.laplace"         299.06     99.67   50787.2      0.00     0.00
"doTryCatch"               103.42     34.47    4339.2      0.00     0.00
"chol"                     103.42     34.47    4339.2      0.00     0.00
"tryCatch"                 103.42     34.47    4339.2      0.00     0.00
"tryCatchList"             103.42     34.47    4339.2      0.00     0.00
"tryCatchOne"              103.42     34.47    4339.2      0.00     0.00
"chol.default"             101.62     33.87    1087.0    101.62    33.87
graf.fit.laplace.R#46       85.80     28.60    3633.2      0.00     0.00
"backsolve"                 78.82     26.27    1635.2     58.40    19.46

我该怎么解释 mem.total ?它是什么，它的单位是什么？我试着看了一下文档，即 ?Rprof和 ?summaryRprof ，但似乎没有很好的记录:-/

编辑: Here他们说 Rprof “以固定的时间间隔探测 R 的 总内存使用量 ”。但这不适合 50GB，这远远超出了我的内存能够容纳的范围! (现在 8GB 物理 + 12 GB 页面文件)。

同样，正如 R Yoda 所指出的， ?summaryRprof说 memory = "both"表示"总内存的变化"。但它究竟是什么(是总内存还是总内存的变化)，它如何与 50GB 数字匹配？

编辑:在 profvis 中进行了相同的分析- 当我将鼠标悬停在 50812 上时，它会显示“内存分配 (MB)”，并将鼠标悬停在靠近该垂直线“峰值内存分配和释放百分比”的黑条上。不确定这意味着什么......这就像 50 GB，这意味着这可能是所有分配的总和(??)......绝对不是峰值内存使用量:

最佳答案

?summaryRprof说:

If memory = "both" the same list but with memory consumption in Mb in addition to the timings.

所以 mem.total以 MB 为单位

With memory = "both" the change in total memory (truncated at zero) is reported [...]

您有 8 GB RAM + 12 GB 交换，但 mem.total宣称您已经使用了 50 GB？

因为是 两个后续探测之间的聚合增量 ( Rprof 在固定时间间隔拍摄的内存使用快照:如果在函数 f 中执行时进行了探测，则将最后一次探测的内存使用增量添加到 f 的 mem.total 中)。

内存使用增量可能为负 但我从未见过负面 mem.total值所以我猜(!)只有正值被添加到 mem.total .

这可以解释您看到的 50 GB 总使用量:它不是单个时间点内分配的内存量，而是整个执行时间内的聚合内存增量。

这也 解释了 gc 的事实仅将 3 GB 显示为“最大使用量 (Mb)” :内存被多次分配和释放/解除分配，这样您就不会遇到内存压力，但这会在 CPU 的计算逻辑之上花费大量时间(在 RAM 中移动如此多的数据会使所有缓存无效，因此速度很慢)适用。

这个摘要(恕我直言)似乎也隐藏了 的事实。垃圾收集器 (gc) 在不确定的时间点启动 清理释放的内存。

由于 gc 开始是惰性的(非确定性的)，恕我直言，将负内存增量归因于刚刚探测的单个函数是不公平的。

我会解释mem.total如 mem.total.used.during.runtime这可能是该列的更好标签。
profvis有更详细的内存使用情况摘要(正如您在问题的屏幕截图中所见):它还汇总了负内存使用量增量(已释放的内存)，但 profvis documentation还警告了缺点:

The code panel also shows memory allocation and deallocation. Interpreting this information can be a little tricky, because it does not necessarily reflect memory allocated and deallcated at that line of code. The sampling profiler records information about memory allocations that happen between the previous sample and the current one. This means that the allocation/deallocation values on that line may have actually occurred in a previous line of code.

更详细的答案需要更多的研究时间(我没有)
- 查看 C 和 R 源代码
- 理解(复制) summaryRprof的聚合逻辑基于 Rprof 创建的数据文件
Rprof数据文件( Rprof.out )如下所示:

:376447:6176258:30587312:152:1#2 "test" 1#1 "test2"

前四个数字(用冒号分隔)表示(见 ?summaryRprof)
- R_SmallVallocSize:R堆上小块中的向量内存[桶数]
- R_LargeVallocSize:大块中的向量内存[桶数](来自malloc)
- R 堆上节点的内存
- 调用内部函数的次数 duplicate在时间间隔内(用于复制向量，例如在函数参数的先写复制语义的情况下)

字符串是函数调用堆栈。

只有前两个数字与计算当前内存使用量(向量)相关，以 MB 为单位:

TotalBuckets = R_SmallVallocSize + R_LargeVallocSize
mem.used = TotalBuckets * 8 Bytes / 1024 / 1024
# 50 MB in the above `Rprof` probe line:
# (376447 + 6176258) * 8 / 1024 / 1024

详情 Vcells见 ?Memory .

顺便说一句:我想试试 summaryRProf(memory = "stats", diff = F)获取当前内存摘要，但我在 Ubuntu 上收到 R3.4.4 64 位的错误消息:

Error in tapply(seq_len(1L), list(index = c("1::#File", "\"test2\":1#1",  : 
  arguments must have same length

你能重现这个(看起来“统计数据”坏了)？

关于r - `Rprof`的内存分析输出的解释，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58250126/

29

4

0

文章推荐： python - 使用 pytest 在 Flask 中测试服务器发送的事件

文章推荐：从 C++ 托管 dll 抛出的 C# 异常 - EEFileLoadException * __ptr64

文章推荐： swift 结合。如何转变出版商值(value)观

sql - 分析/分析 PostgreSQL 上的查询
我刚刚继承了一个旧的 PostgreSQL 安装，需要进行一些诊断以找出该数据库运行缓慢的原因。在 MS SQL 上，您可以使用 Profiler 等工具来查看正在运行的查询，然后查看它们的执行计划。
google-analytics - 将目标从Google Analytics(分析)导入AdWords并更改Google Analytics(分析)中的目标条件
将目标从Analytics（分析）导入到AdWords中，然后在Analytics（分析）中更改目标条件时，是否可以通过更改将目标“重新导入”到AdWords，还是可以自动选择？最佳答案更改目标值
google-analytics - 如何从Google Analytics(分析)界面检查Google Analytics(分析)API参数
我正在使用google analytics api来获取数据。我正在获取数据，但我想验证两个参数，它们在特定日期范围内始终为0。我正在获取['ga:transactions']和['ga:goalCo
google-analytics - 为什么我从Google Analytics(分析)API获取的数据与Google Analytics(分析)网络界面不匹配？
我使用Google API从Google Analytics（分析）获取数据，但指标与Google Analytics（分析）的网络界面不同。即：我在2015年3月1日获得数据-它返回综合浏览量79
knockout.js - Sammy.js与Google Analytics(分析)应用程式中的Google Analytics(分析)
我在我的Web应用程序中使用sammy.js进行剔除。我正在尝试向其中添加Google Analytics（分析）。我很快找到了following plugin来实现页面跟踪。我按照步骤操作，页面如
objective-c - 使用 Xcode 分析(产品>分析)时，有没有办法忽略给定文件中的任何错误？
当使用 Xcode 分析 (product>analyze) 时，有没有办法忽略给定文件中的任何错误？例如编译指示之类的？我们只想忽略第三方代码的任何警告，这样当我们的代码出现问题时，它对我们
日志采集/分析
目录 EFK 1. 日志系统 2. 部署ElasticSearch 2.1 创建handless服务 2.2 创建s
分析 - 跟踪每个用户的操作
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
GCC代码统计/分析
GCC/G++ 是否有可用于输出分析的选项？能够比较以前的代码与新代码之间的差异(大小、类/结构的大小)将很有用。然后可以将它们与之前的输出进行比较以进行比较，这对于许多目的都是有用的。如果没有此
Haskell 分析
我正在浏览 LYAH，并一直在研究处理列表时列表理解与映射/过滤器的使用。我已经分析了以下两个函数，并包含了教授的输出。如果我正确地阅读了教授的内容，我会说 FiltB 的运行速度比 FiltA 慢很
MySQL 分析
在 MySQL 中可以使用 SET profiling = 1; 设置分析查询 SHOW PROFILES; 显示每个查询所用的时间。我想知道这个时间是只包括服务器的执行时间还是还包括将结果发送到前
Python 分析
我用 Python 编写了几个用于生成阶乘的模块，我想测试运行时间。我找到了一个分析示例 here我使用该模板来分析我的模块: import profile #fact def main():
mysqld_safe启动脚本源码阅读、分析
前几天读了下mysqld_safe脚本，个人感觉还是收获蛮大的，其中细致的交代了MySQL数据库的启动流程，包括查找MySQL相关目录，解析配置文件以及最后如何调用mysqld程序来启动实例等，有着
内网之工作组、域分析
1 内网基础内网/局域网（Local Area Network，LAN），是指在某一区域内有多台计算机互联而成的计算机组，组网范围通常在数千米以内。在局域网中，可以实现文件管理、应用软件共享、打印机
内网之工作组、域分析
1 内网基础内网/局域网（Local Area Network，LAN），是指在某一区域内有多台计算机互联而成的计算机组，组网范围通常在数千米以内。在局域网中，可以实现文件管理、应用软件共享、打印机
vba - Excel中的自动数据排序/分析
我有四列形式的数据。前三列代表时间，value1，value 2。第四列是二进制，全为 0 或 1。当第四列中对应的二进制值为0时，有没有办法告诉excel删除时间、值1和值2？我知道这在 C++ 或
Haskell 分析 - clock_gettime
我正在运行一个进行长时间计算的 Haskell 程序。经过一些分析和跟踪后，我注意到以下内容: $ /usr/bin/time -v ./hl test.hl 9000045000050000 Com
ASP.NET 分析
我有一个缓慢的 asp.net 程序正在运行。我想分析生产服务器以查看发生了什么，但我不想显着降低生产服务器的速度。一般而言，配置生产盒或仅本地开发盒是标准做法吗？另外，您建议使用哪些程序来实现这一
固定时间的 Haskell 分析
我目前正在尝试分析 Haskell 服务器。服务器永远运行，所以我只想要一个固定时间的分析报告。我尝试只运行该程序 3 分钟，然后礼貌地要求它终止，但不知何故，haskell 分析器不遵守术语信号，并
maven - 分析 Maven
是否有工具可以分析 Maven 构建过程本身，以便我可以看到构建花费最多时间的地方？我们在工作中遇到了关于 Maven 3.0.3 和 3.0b1 的问题。与 3.0.3 (9m00s) 相比，我们

首页

博学

6Ren·AI

商城

r - `Rprof`的内存分析输出的解释