r - 在 R 中，为什么 sum 与其他方法(例如 cumsum)相比如此慢？-6ren

r - 在 R 中，为什么 sum 与其他方法(例如 cumsum)相比如此慢？

转载作者：行者123 更新时间：2023-12-03 01:58:00

25

4

我正在尝试实现一个需要非常快的函数，主要是因为它一遍又一遍地处理巨大的数据帧。

R 总是让我感到困惑，为什么它有时有点慢，为什么有时又慢得离谱。 (不幸的是，它永远不会快。)

不管怎样，我一直认为，如果可能的话，当以某种方式插入 apply、sapply 或 lapply 时，而不是放入循环中，事情可以运行得更快。我最近遇到一个例子，它让我觉得幕后还有更多的事情发生，如果我理解它，可能会对我 future 的优化有很大帮助。

以下是我在相对强大的 Ubuntu Linux 机器上运行的一些计算:

system.time(sapply(1:1e5, sum))
user  system elapsed
35.130   0.000  35.128


system.time(sapply(1:1e5, cumsum))
user  system elapsed
0.110   0.000   0.108

是的，您正确地读取了这些数字:cumsum(它创建累积和的数组)比仅仅提供简单的总和要快几个数量级。 (如果其他人可以在他们的计算机上验证这些结果，那就太好了!)

我不明白这是怎么可能的，除非实现有很大不同。假设它们确实有很大不同，我想知道以什么方式，这样我就可以在寻找速度时寻找某些要避免的函数。 (对于核心函数，我不知道如何查看它们的源代码。仅输入不带任何括号的函数名称的标准方法不适用于核心函数。)

非常感谢!

最佳答案

或多或少遵循instructions for using operf我用单行 sapply(1:1e5, sum) 创建了一个文件并运行

$ operf ~/bin/R-3-1-branch/bin/R -f sum.R
$ opreport -l ~/bin/R-3-1-branch/lib/libR.so |less

制作

CPU: Intel Sandy Bridge microarchitecture, speed 2.401e+06 MHz (estimated)
Counted CPU_CLK_UNHALTED events (Clock cycles when not halted) with a unit mask of 0x00 (No unit mask) count 100000
samples  %        image name               symbol name
835882   93.0929  libR.so                  RunGenCollect
27731     3.0884  libR.so                  SortNodes
9323      1.0383  libR.so                  AgeNodeAndChildren
2038      0.2270  libR.so                  CheckFinalizers
1593      0.1774  libR.so                  Rf_allocVector3
1222      0.1361  libR.so                  duplicate1
...

等等。大部分时间都花在垃圾收集器上(RunGenCollect——运行分代垃圾收集器)。于是我就跑了

$ R -d gdb R
(gdb) run
> sapply(1:1e5, sum)
^C
(gdb) break RunGenCollect
(gdb) continue
Continuing.

Breakpoint 1, RunGenCollect (size_needed=50000) at /home/mtmorgan/src/R-3-1-branch/src/main/memory.c:1504
1504        bad_sexp_type_seen = 0;
(gdb) where

产生的

#0  RunGenCollect (size_needed=50000) at /home/mtmorgan/src/R-3-1-branch/src/main/memory.c:1504
#1  0x00007ffff789d354 in R_gc_internal (size_needed=50000) at /home/mtmorgan/src/R-3-1-branch/src/main/memory.c:2825
#2  0x00007ffff789e99b in Rf_allocVector3 (type=13, length=100000, allocator=0x0) at /home/mtmorgan/src/R-3-1-branch/src/main/memory.c:2563
#3  0x00007ffff788e1a5 in Rf_allocVector (type=13, length=100000) at /home/mtmorgan/src/R-3-1-branch/src/include/Rinlinedfuns.h:189
#4  0x00007ffff7831787 in duplicate1 (s=0x7ffff3b0b010, deep=TRUE) at /home/mtmorgan/src/R-3-1-branch/src/main/duplicate.c:335
#5  0x00007ffff783371a in duplicate_child (s=0x7ffff3b0b010, deep=TRUE) at /home/mtmorgan/src/R-3-1-branch/src/main/duplicate.c:199
#6  0x00007ffff783357a in duplicate_list (s=0x2c98b30, deep=TRUE) at /home/mtmorgan/src/R-3-1-branch/src/main/duplicate.c:261
#7  0x00007ffff7830fc2 in duplicate1 (s=0x2c98b30, deep=TRUE) at /home/mtmorgan/src/R-3-1-branch/src/main/duplicate.c:308
#8  0x00007ffff783371a in duplicate_child (s=0x2c98b30, deep=TRUE) at /home/mtmorgan/src/R-3-1-branch/src/main/duplicate.c:199
#9  0x00007ffff783357a in duplicate_list (s=0x2c98a88, deep=TRUE) at /home/mtmorgan/src/R-3-1-branch/src/main/duplicate.c:261
#10 0x00007ffff7830fc2 in duplicate1 (s=0x2c98a88, deep=TRUE) at /home/mtmorgan/src/R-3-1-branch/src/main/duplicate.c:308
#11 0x00007ffff7830c7f in Rf_duplicate (s=0x2c98a88) at /home/mtmorgan/src/R-3-1-branch/src/main/duplicate.c:132
#12 0x00007ffff79257f4 in do_summary (call=0x2c98a88, op=0x6259a0, args=0x303cf88, env=0x2c97f48) at /home/mtmorgan/src/R-3-1-branch/src/main/summary.c:462
...

这里的相关行是第 462 行

(gdb) up 12
#12 0x00007ffff79257f4 in do_summary (call=0x2c98a88, op=0x6259a0, args=0x303cf88, env=0x2c97f48) at /home/mtmorgan/src/R-3-1-branch/src/main/summary.c:462
462     PROTECT(call2 = duplicate(call));
(gdb) list
457     return ans;
458     }
459 
460     /* match to foo(..., na.rm=FALSE) */
461     PROTECT(args = fixup_NaRm(args));
462     PROTECT(call2 = duplicate(call));
463     SETCDR(call2, args);
464 
465     if (DispatchGroup("Summary", call2, op, args, env, &ans)) {
466     UNPROTECT(2);

调用正在重复

(gdb) call Rf_PrintValue(call)
FUN(1:100000[[5339L]], ...)

对于循环的每次迭代，触发垃圾收集。对于 cumsum，不执行类似的代码。这种情况已经持续了很长一段时间，但原因并非 100% 明显

$ svn annotate ~/src/R-3-1-branch/src/main/summary.c |less
...
 42643     ripley     /* match to foo(..., na.rm=FALSE) */
 42643     ripley     PROTECT(args = fixup_NaRm(args));
 42643     ripley     PROTECT(call2 = duplicate(call));
 42643     ripley     SETCDR(call2, args)
...
$ svn log -r42643
------------------------------------------------------------------------
r42643 | ripley | 2007-08-25 23:09:50 -0700 (Sat, 25 Aug 2007) | 1 line

make the rest of the group generics primitive
------------------------------------------------------------------------

在 R-devel 上讨论这个问题会很有趣。邮件列表。并不是 sum 特别慢，而是对垃圾收集器的调用占据了执行时间。

嗯，仔细一想，发现

sapply(1:1e5, function(x) sum(x))

与cumsum在同一个范围内运行。我认为这是因为原始版本中第 462 行的 duplicate 正在制作 1e5 元素的副本，以准备选择第 i 个元素进行求和。相反，在 function(x) sum(x) 中，向量已经是子集，因此仅重复第 i 个元素。复制原始向量还解释了为什么 1e5 元素比 1e4 元素慢得多，以及为什么 as.list(1:1e5) 性能相对较高(实际上仅复制列表元素，或者甚至可能不复制)那)。调用 sum 期间的重复与它属于 (S3) Summary 组泛型这一事实有关，请参阅 ?"group generic".

关于r - 在 R 中，为什么 sum 与其他方法(例如 cumsum)相比如此慢？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23530915/

25

4

0

文章推荐：诺基亚 S40 应用程序开发

文章推荐： excel - 如何在Excel公式中连接相对字符数的字符串？

文章推荐： visual-studio-code - 启用或禁用 VS Code 集成终端选项卡？

c++ - Eigen sum()、colwise().sum().sum() 和 rowwise().sum().sum() 都给出了不同的答案
我有这个示例代码: #include #include int main() { Eigen::MatrixXf M = Eigen::MatrixXf::Random(1000, 1000)
sum - 当 sum() 一列时，我收到此错误 AttributeError : 'DataFrame' object has no attribute 'sum'
我有一个像这样的数据框: +-----+--------+ |count| country| +-----+--------+ | 12| Ireland| | 5|Thailand| +-
带条件的字段的 MySQL SUM，IF(SUM(bill_1) IS NULL, '99' , SUM(bill_1)) AS tot_bill_1
我想要 SUM(tot_bill_1+tot_bill_2) AS 总计，但这不起作用 SELECT *, IF(SUM(bill_1) IS NULL, '99', SUM(bill_1)) AS
performance - matlab sum(X-Y) vs sum(X) - sum(Y)
如果我们有两个矩阵 X 和 Y，都是二维的，现在在数学上我们可以说:sum(X-Y)=sum(X)-总和(Y). Matlab 哪个效率更高？哪个更快？最佳答案在我的机器上，sum(x-y) 对于
sql - 为什么 SUM(a + b) != SUM(a) + SUM(b) 在 Hive 中？
我正在运行 Hive 1.1.0 并看到对于两个 bigint 列，active_users 和 inactive_users，SUM(active_users + inactive_users) <
Mysql SUM 的 SUM
是否可以在一个选择查询中求和？类似这样的事情: SELECT id, SUM(current_price - bought_price)*amount AS profit FROM purchase
sql - 为什么 SUM(COL1 + COL2) 和 SUM(COL1) + SUM(COL2) 会产生不同的结果？
这是一个相当奇怪的结果。我希望这些具有相同的产量。下面还有从数据库中提取的 excel 链接。 https://twentius.opendrive.com/files?89038281_muoyg
tsql - 在 TSQL 中，SUM(A + B) 与 SUM(A) + SUM(B) 之间是否存在性能差异？
我必须对 2 个字段求和，然后再求和。从性能的角度来看，先添加字段还是在对列求和之后添加字段有什么区别？方法 1 = SELECT SUM(columnA + columnB) 方法 2 = SEL
arrays - 在这些条件下，是否有可能比 O(n^2) 更好地执行 3-sum/4-sum...k-sum？ - 技术面试
这是一个经典问题，但我很好奇是否有可能在这些条件下做得更好。问题:假设我们有一个长度为4*N的排序数组，即每个元素重复4次。请注意，N 可以是任何自然数。此外，数组中的每个元素都受制于 0 A. 执
sum - PIG : sum and division, 创建对象
我正在编写一个 Pig 程序，该程序加载一个用制表符分隔整个文件的文件例如:名称 TAB 年份 TAB 计数 TAB... file = LOAD 'file.csv' USING PigStora
sql-server - SUM 一列然后减去另一列的 SUM
我有一个包含以下字段的表: EmpID, Code, Amount, TransDate, CM, CMDate 我想要进入数据网格的是 SUM所有的Amount具有相同的 Code和 SUM CM具
php - 在一个查询中显示月 SUM 和年 SUM
我有两个单独的查询用于提取报告信息。一年效果很好。但是，如果一个月超过 1 年，则不会显示正确的响应。这是我的两个查询: select SUM(rpt_complete.total) total,
MySQL SUM(列) + (SUBQUERY WITH SUM)
我想查询一个团队的积分。通过在列上执行 SUM + 来自具有相同团队 ID 的另一个表的 SUM 来添加这些点。我试着这样写: SELECT k.id, s.fylke, s.
mysql - SUM - 为什么我在使用 sum 和使用计算器时得到不同的总和)？
这个问题在这里已经有了答案: How to deal with floating point number precision in JavaScript? (47 个回答) Unexpected
algorithm - 为什么 sum(x/y)/n 不等于 sum(x)/sum(y) 其中 x 和 y 是 n 个正整数的向量？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 5 年前。 Improve
SQL Sum of last X Sum of records
我已经找了一段时间，但找不到这个问题的答案(也许我没有搜索正确的术语或其他东西)。基本上，我有一个数据库，每个日期有任意数量的条目。我需要取包含条目的最后 X 天的总和(忽略没有条目的天数)。我知道如
google-sheets - 在谷歌电子表格查询中使用 sum 会导致许多单元格中的单词 "sum"
我正在尝试获取 B 行中包含 A 行中某个值的所有值中的一些值。我猜这个问题很简单。这是我的查询: =QUERY('Sheet1'!$A$16:D, "Select sum(D) Where C c
mysql - SQL 查询语法错误 : unexpected 'SUM' (sum)
我正在尝试运行以下查询，但出现以下错误: You have an error in your SQL syntax; check the manual that corresponds to your
php - MySQL 中的行明智 SUM 与列明智 SUM
我有一个 tableA，其中包含以下结构我将此结构修改为如下所示的tableB，以减少行数，并且类别是固定长度的假设我在 tableA 中修改为新结构后有 210 万条数据，tableB 仅包含
sql - 每行的 SUM 和过滤结果 SUM IN $x
我的表在 Postgres 中的数据: id user_id sell_amount sell_currency_id buy_amount buy_currency_id type

首页

博学

6Ren·AI

商城

r - 在 R 中，为什么 sum 与其他方法(例如 cumsum)相比如此慢？