r - 在r中的某个阈值处破坏 cumsum() 函数-6ren

r - 在r中的某个阈值处破坏 cumsum() 函数

转载作者：行者123 更新时间：2023-12-01 02:36:30

25

4

例如我有以下代码:

cumsum(1:100)

如果元素 i+1 大于 3000，我想打破它。我怎样才能做到这一点？

所以不是这个结果:

[1]    1    3    6   10   15   21   28   36   45   55   66   78   91  105  120  136  153  171  190  210  231  253  276  300
 [25]  325  351  378  406  435  465  496  528  561  595  630  666  703  741  780  820  861  903  946  990 1035 1081 1128 1176
 [49] 1225 1275 1326 1378 1431 1485 1540 1596 1653 1711 1770 1830 1891 1953 2016 2080 2145 2211 2278 2346 2415 2485 2556 2628
 [73] 2701 2775 2850 2926 3003 3081 3160 3240 3321 3403 3486 3570 3655 3741 3828 3916 4005 4095 4186 4278 4371 4465 4560 4656
 [97] 4753 4851 4950 5050

我想要得到以下结果:

 [1]    1    3    6   10   15   21   28   36   45   55   66   78   91  105  120  136  153  171  190  210  231  253  276  300
 [25]  325  351  378  406  435  465  496  528  561  595  630  666  703  741  780  820  861  903  946  990 1035 1081 1128 1176
 [49] 1225 1275 1326 1378 1431 1485 1540 1596 1653 1711 1770 1830 1891 1953 2016 2080 2145 2211 2278 2346 2415 2485 2556 2628
 [73] 2701 2775 2850 2926

最佳答案

正如我在评论中提到的，即使对于像我这样的人来说，在 Rcpp 中编写简单的东西也不应该是什么大问题。这是一个非常原始的实现，似乎可以工作(感谢@MatthewLundberg 的改进建议)

library(Rcpp)
cppFunction('NumericVector cumsumCPP(NumericVector x, int y = 0){

    // y = 0 is the default
    // Need to do this in order to avoid modifying the original x
    int n = x.size();
    NumericVector res(n);
    res[0] = x[0];

    for (int i = 1 ; i < n ; i++) {
      res[i] = res[i - 1] + x[i];
      if (res[i] > y && (y != 0)) { 
        // This breaks the loop if condition met
        return res[seq(0, i - 1)];
      }
    }

    // This handles cases when y== 0 OR y != 0 and y > cumsum(res)
    return res;
}')

cumsumCPP(1:100, 3000)
#  [1]    1    3    6   10   15   21   28   36   45   55   66   78   91  105  120  136  153  171  190  210  231  253  276  300
# [25]  325  351  378  406  435  465  496  528  561  595  630  666  703  741  780  820  861  903  946  990 1035 1081 1128 1176
# [49] 1225 1275 1326 1378 1431 1485 1540 1596 1653 1711 1770 1830 1891 1953 2016 2080 2145 2211 2278 2346 2415 2485 2556 2628
# [73] 2701 2775 2850 2926

与基本 Rs cumsum 类似，这适用于整数和 float ，但不处理 NA。 treshhold 的默认值设置为 0 - 如果您想限制负的 cumsum，这并不理想，但我现在想不出任何更好的值(您可以自行决定)。

虽然它可以使用一些优化...

set.seed(123)
x <- as.numeric(sample(1:1e3, 1e7, replace = TRUE))
microbenchmark::microbenchmark(cumsum(x), cumsumCPP(x))
# Unit: milliseconds
#         expr      min        lq      mean   median        uq       max neval cld
#    cumsum(x) 58.61942  61.46836  72.50915  76.7568  80.97435  99.01264   100  a 
# cumsumCPP(x) 98.44499 100.09979 110.45626 112.1552 119.22958 131.97619   100   b

identical(cumsum(x), cumsumCPP(x))
## [1] TRUE

关于r - 在r中的某个阈值处破坏 cumsum() 函数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42328945/

25

4

0

文章推荐： javascript - Wordpress 类似管理员的菜单

文章推荐： javascript - 如何在登录模板周围添加不同的图标？

文章推荐： python - 如何访问自定义 prop_cycle 颜色？

python - Cumsum 列，同时跳过行或根据实际 cumsum 的结果在条件上设置固定值
我正在尝试在 pandas 中找到一个矢量化解决方案，该解决方案在电子表格中很常见，即在基于实际 cumsum 的结果跳过或设置固定值的情况下进行 cumsum。我有以下内容: A 1 0
python - 如果 cumsum 大于值，则重新启动 cumsum 并获取索引
假设我有一个距离数组 x=[1,2,1,3,3,2,1,5,1,1]。我想从 x 中获取索引，其中 cumsum 达到 10，在本例中，idx=[4,9]。所以 cumsum 在满足条件后重新启动
python - 每当超过某个 cumsum 阈值时如何对 pandas 行进行分组(为每个新组重新启动 cumsum)
每当超过给定的 cumsum 阈值时，我需要有关对连续行进行分组的帮助。当超过此阈值时，也应重新启动 cumsum(为零)，如下所示: Index Values Regular CumS
python-3.x - 在 Python Pandas 中，将 cumsum 与 groupby 结合使用，并在值为 0 时重置 cumsum
我对 python 还很陌生。我尝试对每个客户进行累积总和，以查看相应的不活动月份(标志:1 或 0)。因此，当我们有 0 时，需要重置 1 的累积和。当我们有新客户端时，也需要重置。请参阅下面的示例
在达到特定值时重置 cumsum
我要重置 cumsum在一个向量上，当它达到某个值时。例如。对于以下向量: v <- c(3, 5, 2, 5, 3, 4, 5, 3, 1, 4) 预期输出为: c(0, 0, 10, 0, 0,
带有reduce函数的python cumsum
我正在尝试使用reduce函数在python中编写累积和的版本。这是到目前为止我的代码: from functools import reduce def my_cum_sum(arg): r
python - 二叉搜索树 cumsum
问题:给定一个二叉搜索树，其中的键是数字，我们将定义操作“cumsum”(累积和的简写)，它切换树中每个节点的键所有小于或等于它的键的总和。例如，在这个例子中，根中的键 5 切换为值 10:根中
pandas cumsum 跳过专栏
我是 pandas 的新手，我可以将 cumsum 添加为 df.cumsum(axis=1) y0 y1 y2 0 2 3 4 1 2 2 3 2 0 0
R cumsum 与基于值的乘法
我有一个正数向量，使得 - 如果数字大于或等于 1，则相加 - 如果数字小于 1，则乘以累积和。例如 > set.seed(0) > x x [1] 3.0 0.9 0.9 1.0 3.0 0.
r - 通过运行信号值计算 `cumsum`
我想计算cumsum从每次运行信号开始的某个值，其中 signal == 1 . 示例数据: set.seed(123) df head(df,12) Date value sig
r - Cumsum 重置为特定值
这个问题在这里已经有了答案: Cumsum with reset when 0 is encountered and by groups (2 个回答) Cumulative sum that res
python - 如何找到列的 cumsum？
dict={"asset":["S3","S2","E4","E1","A6","A8"], "Rank":[1,2,3,4,5,6],"number_of_attributes":[2,1,2,2,
python - 重新启动的 Cumsum
这个问题在这里已经有了答案: Restart cumsum and get index if cumsum more than value (3 个答案) 关闭 2 年前。我想在每次超过阈值 10
r - 计算以零为底的累积总和 (cumsum)
我想修改 cumsum 函数。我想将负值更改为 0。并且当有一个不同于 0 的新 D 值时，则使用 D-S。下面的例子: TD % group_by(product) %>% mutate(res
r - 在一列中迭代使用 cumsum()
是否可以在一列中迭代使用 cumsum() 并在另一列上以开始 - 停止为条件: 给定数据帧 df 和一列 X 其中值是递增的。 cumsum() 应在达到 10 或 10 的倍数时停止(例如 20、
r - 按组计算累积和(cumsum)
带有数据框: df <- data.frame(id = rep(1:3, each = 5) , hour = rep(1:5, 3)
python - 如何在值符号更改后重置 cumsum？
In [46]: d = np.random.randn(10, 1) * 2 In [47]: df = pd.DataFrame(d.astype(int), columns=['data'])
r - 基于组仅对值计数一次的 CumSum
我目前正在尝试创建一个累积总和列，该列将根据 Game_ID 创建一个累积总和，但一次只计算与 Game_ID 相关的值。例如，玩家 A 在 Game_ID == 1 中拍摄 20 次，在 Game_
r - 从末尾到开头计算 cumsum
我正在尝试计算每组从最后一行到第一行的cumsum。示例数据: t1 ts var val val2 1 a 0 2 2 a 0 2 3 a 0
r - 按列使用 cumsum
我有一个矩阵，例如: A= [ 1 2 3 4 3 5 6 6 4 1 2 3 ] 我想以另一个矩阵(或数据框)的形式获取列的累积和。例如，这个矩阵会给出: B= [1 2 3 4

首页

博学

6Ren·AI

商城

r - 在r中的某个阈值处破坏 cumsum() 函数