R/dplyr : Using a loop to create lags and calculate cumulative sums based on column names-6ren

R/dplyr : Using a loop to create lags and calculate cumulative sums based on column names

转载作者：行者123 更新时间：2023-12-02 19:19:41

25

4

我想循环遍历大型数据框中的一长列列，并计算列滞后值的累积和。换句话说，我在计算每次观察之前“完成”了多少工作。

玩具数据框有助于使这一点更清晰。

id = c("a", "a", "a", "b", "b")
date = seq(as.Date("2015-12-01"), as.Date("2015-12-05"), by="days")
v1 = sample(seq(1, 20), 5)
v2 = sample(seq(1, 20), 5)
df = data.frame(id, date, v1, v2)

我希望它看起来像

id   date         v1   v2   v1Cum   v2Cum
a    2015-12-01   1    13     0       0
a    2015-12-02   7    11     1       13
a    2015-12-03   12   2      8       24
b    2015-12-04   18   6      0       0
b    2015-12-05   4    9      18      6

所以它不是 id 组内 v1 或 v2 的累积和，而是每个 id 滞后值的累积和。

我可以在各个列上执行此操作，没有问题，但我似乎无法用循环来概括它:

vars = c("v1", "v2")
for (var in vars) {
  lagname = paste(var, "Lag", sep="")
  cumname = paste(var, "Cum", sep="")
  df = arrange(df, id, date)
  df = df %>% 
    group_by(id) %>% 
    mutate(!!lagname := dplyr::lag(var, n = 1, default = NA))
  df[[lagname]] = ifelse(is.na(df[[lagname]]), 0, df[[lagname]])
  df = df %>% group_by(id) %>% arrange(date) %>% mutate(!!cumname := cumsum(!!lagname))
}

据我所知，问题是

滞后变量的计算结果为 NA(或 ifelse() 之后为 0)。我知道我还没有完全掌握 mutate()。
累积求和结果为 NA

有什么想法吗？谢谢您的帮助! (在休息几年后，我试图重新开始编码。然而，我的主要“语言”是 Stata，所以我想我在这方面的做法有点奇怪。很高兴能完全修改它!)

最佳答案

如果我理解正确，以下内容应该有效:

可重现的样本数据(有 3 个变量用于求和):

set.seed(123)
df = data.frame(
  id = c("a", "a", "a", "b", "b"),
  date = seq(as.Date("2015-12-01"), as.Date("2015-12-05"), by="days"),
  v1 = sample(seq(1, 20), 5),
  v2 = sample(seq(1, 20), 5),
  v3 = sample(seq(1, 20), 5)
)

> df
  id       date v1 v2 v3
1  a 2015-12-01  6  1 20
2  a 2015-12-02 15 11  9
3  a 2015-12-03  8 17 13
4  b 2015-12-04 16 10 10
5  b 2015-12-05 17  8  2

按 ID 分组，按日期排序(如果它们不按顺序排列)，并对两个命名变量之间的所有命名变量进行变异(在本例中为 v1:v3):

df %>%
  group_by(id) %>%
  arrange(date) %>%
  mutate_at(vars(v1:v3), funs(Cum = cumsum(lag(., default = 0)))) %>%
  ungroup()


# A tibble: 5 x 8
# Groups: id [2]
  id     date          v1    v2    v3 v1_Cum v2_Cum v3_Cum
  <fctr> <date>     <int> <int> <int>  <int>  <int>  <int>
1 a      2015-12-01     6     1    20      0      0      0
2 a      2015-12-02    15    11     9      6      1     20
3 a      2015-12-03     8    17    13     21     12     29
4 b      2015-12-04    16    10    10      0      0      0
5 b      2015-12-05    17     8     2     16     10     10

关于R/dplyr : Using a loop to create lags and calculate cumulative sums based on column names，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50595177/

25

4

0

文章推荐： vbscript - 如何从 VBScript 打开命名管道？

文章推荐： assembly - MASM 中的 _emit 相当于什么

文章推荐： word-wrap - Aptana Studio 3 Beta 中的自动换行/换行选项？

文章推荐： angularjs - 页面加载时调用 Ionic 无限滚动函数

c# - : test-create, try-create、create-catch 哪种设计最可取？
假设有一个创建用户的操作。如果存在指定的电子邮件或用户名，此操作可能会失败。如果它失败了，则需要确切地知道原因。在我看来，有三种方法可以做到这一点，我想知道是否有明显的赢家。所以，这是一个类用户:
javascript - Object.create 与 Object.create() 与 Object.create(null)
var obj1 = Object.create; console.log(typeof obj1); var obj2 = Object.create(null); console.log(type
getting this error after building the ts files yield User.create({ ^ TypeError: Cannot read properties of undefined (reading 'create')(在生成ts文件后获得此错误将产生User.create({^TypeError：无法读取未定义的属性(正在读取‘Create’)))
I am getting this error after running npm run build yield User.create({^在运行NPM Run Build Year Use
javascript - Object.create(Object.prototype) , Object.create(Object) 和 Object.create(null) 之间的区别
我应该为其他人将从中继承的第一个父对象传递哪个参数，哪个参数更有效 Object.create(Object.prototype) Object.create(Object) Object.creat
sql-server - SQL Server : Syntax near keyword 'CREATE' when batch executing CREATE SCHEMA and CREATE TABLE
我正在尝试使用 JDBC(最新版本)设置 SQL Server 2008 数据库。我有一个我想一起执行的 setup sql 命令列表: 基本上我做的是: connection.setAutoCom
amazon-web-services - AWS : create json template to create auto scaling group to create 2 EC2 instances
我正在尝试创建一个 CloudFormation 模板来创建一个 Auto Scaling 组，以便我可以从中启动 2 个实例。我已经创建了 Auto Scaling 组，但我不知道如何编写用于从
While creating loop carousel with elementor pro, "create a template" button does not allow me to create a template(当用elementor Pro创建循环旋转木马时，“创建模板”按钮不允许我创建模板)
我正在创建我的第一个WordPress网站。我已经在我的网站上安装了Elementor Pro插件。随之而来的一个有利因素是“循环旋转木马”。。。当我把它添加到我的页面时，一切似乎都在工作，但是当我点
create-react-app - create-react-app中的ENOSPC错误
create-react-app error 我从终端运行yarn start时收到此错误消息...我尝试了sudo killall node和许多其他过程来清除i-node却没有成功。我也将我的c
workflow - "Created On"和 "Record Created On"之间的区别
在 CRM 中，当我尝试设置工作流程时，我可以选择与某个实体的创建时间相关的超时。涉及三个字段。记录创建于创建于修改时间虽然最后一个很明显，但我看不出其他两个之间有任何逻辑上的区别。最佳答案
create-react-app - create-react-app创建的package.json中browserslist的意义是什么
我在一次采访中被问到这个问题。我无法回答。 "browserslist": [ ">0.2%", "not dead", "not ie <= 11", "not op_mini all" ] 我可以
ruby-on-rails - Rails .create() 与 controller#create
这是一个 Rails 新手问题: 当我在模型上调用 create() 时，它会绕过关联的 Controller create 操作吗？例如，这没有命中我的标签 Controller #create
oracle - CREATE TABLE 和 CREATE ANY TABLE 权限的区别
我不明白这两种特权之间的区别。我找到了这两种解释，但对我没有帮助。 CREATE TABLE -> Enables a user to create a table owned by that us
Sharepoint 工作流创建任务属性 : when to create fields and when to create depepndency properties?
我是 SharePoint 工作流的新手。创建新任务并分配 TaskId 时，我有两个选项: 创建一个新字段来保存 TaskId 创建一个新属性来保存 TaskId。新属性是一个依赖属性。我的问
delphi - TDataModule 后代 'created' 没有 .Create 但没有问题？
我突然注意到我们的代码库中有一个TDataModuleTestExchange(nil)“构造函数调用”: procedure TDialoogConfigExchange.ButtonTestCli
delphi - 我可以使用 .Create(Nil) 而不是 .Create(Application)
我有一个具有 TComponent 变量的单元，我在单元初始化时创建此组件，如下所示: var XComp: TComponent; . . . . initialization begin
php - Composer : Updating a Project Created with `create-project`
Composer 是否提供了更新项目创建时使用的包的方法？即，如果我使用以下内容创建一个新的 Laravel 项目 composer create-project --prefer-dist lara
java - hbm2ddl.auto= create/create-drop 也会删除数据吗？
在 Hibernate 中，如果我们将 hbm2ddl.auto 设置为 create/create-drop ，那么它将在启动时删除旧模式并创建新模式。这意味着，它也会删除数据？..我的疑问是，如果
Dockerhub Create Automated Build 步骤卡在“Creating”处
我使用了 create an Automated Build 中的此链接 ( this guide ) . 浏览器错误控制台显示: https://hub.docker.com/v2/reposito
sql - CREATE PROC 和 CREATE PROCEDURE 有什么区别？
我已经搜索了 msdn 并没有找到答案。我应该知道有什么区别吗？如果真的没有区别，那么为什么会存在这种冗余？ --SQL Server Stored Procedure Syntax CREATE
javascript - "create"指定主 "create"时不使用嵌套对象的 KO 映射选项
我有以下内容: var CardViewModel = function (data) { ko.mapping.fromJS(data, {}, this); this.editin

首页

博学

6Ren·AI

商城

R/dplyr : Using a loop to create lags and calculate cumulative sums based on column names