- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想转置时间序列数据集以输入到一些机器学习算法中。这是我想做的一个例子,除了滞后的数量很大,我正在寻找一种更优雅的方法来做到这一点:
set.seed(42)
data <- data.frame(time = 1:5, value = rnorm(5))
data
# time value
# 1 1 1.3709584
# 2 2 -0.5646982
# 3 3 0.3631284
# 4 4 0.6328626
# 5 5 0.4042683
data %>%
mutate(lag_1 = lag(value),
lag_2 = lag(value, 2),
lag_3 = lag(value, 3),
lag_4 = lag(value, 4),
lag_5 = lag(value, 5))
# time value lag_1 lag_2 lag_3 lag_4 lag_5
# 1 1 1.3709584 NA NA NA NA NA
# 2 2 -0.5646982 1.3709584 NA NA NA NA
# 3 3 0.3631284 -0.5646982 1.3709584 NA NA NA
# 4 4 0.6328626 0.3631284 -0.5646982 1.3709584 NA NA
# 5 5 0.4042683 0.6328626 0.3631284 -0.5646982 1.370958 NA
最佳答案
您可以更方便地使用 data.table
进行转换,因为 data.table
中的 shift
允许使用参数 n
是向量,而 dplyr 中的 lag 函数不是向量。
library(data.table)
> setDT(data)[, paste("lag", 1:5, sep = "_") := shift(value, 1:5)]
> data
time value lag_1 lag_2 lag_3 lag_4 lag_5
1: 1 -1.4162466 NA NA NA NA NA
2: 2 -0.2366333 -1.4162466 NA NA NA NA
3: 3 0.5146632 -0.2366333 -1.4162466 NA NA NA
4: 4 1.9243923 0.5146632 -0.2366333 -1.4162466 NA NA
5: 5 1.6161165 1.9243923 0.5146632 -0.2366333 -1.416247 NA
要更具体地了解 shift
和 lag
,这里有一个示例,说明 lag
函数不允许您执行哪些操作shift
可以。
> vec <- 1:10
> shift(vec, 1:2)
[[1]]
[1] NA 1 2 3 4 5 6 7 8 9
[[2]]
[1] NA NA 1 2 3 4 5 6 7 8
> lag(vec, 1:2)
Error in lag(vec, 1:2) : n must be a single positive integer
In addition: Warning message:
In if (n == 0) return(x) :
the condition has length > 1 and only the first element will be used
关于r - 使用 dplyr 转置时间序列(有滞后的变异),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37128099/
我有一个包含配对数据的数据集(同一家庭的成员)。 身份证 是个人标识符和 户号是合作伙伴的标识符(反之亦然)。 我需要的是为每个 添加一个额外的列(职业)。 id 他\她的伴侣。 我的数据看起来像这样
mutate 能否根据跨变量应用的逻辑条件创建新变量? 更具体地说,请考虑以下数据。 set.seed(1234) val = 1) head(dat) a b c d anyABCD 1 0 0
我的 df 看起来像这样: df % mutate_at(vars(starts_with("paid")), list(prc = ~. / expenses)) # expenses mon
我的 df 看起来像这样: df % mutate_at(vars(starts_with("paid")), list(prc = ~. / expenses)) # expenses mon
我在这里为项目 Euler 问题 31 运行了这个简单的代码。 不需要 Euler Q;我只想知道,为什么我的列表值会发生变化,即这是打印 [2.0,2.0,2.0,2.0,2.0] 的许多列表的列表
我使用了排列和变异组合来根据分组进行添加。例如,我使用了以下内容: master_df % group_by(asof_dt) %>% mutate(tot_flag = sum(ls_fla
我在让 mutate、cross 和 case_when 正常运行时遇到了一些麻烦,我在这里重新创建了一个简单版本的问题: a 1 1 2 3 2 2
我有代表用户某种交易类型的不规则时间序列数据。每行数据都带有时间戳,表示当时的事务。由于数据的不规则性质,某些用户一天可能有100行,而其他用户一天可能有0或1个事务。 数据可能看起来像这样: dat
您如何恰本地解释为什么这两个示例不同? // Reassignment let a = 1; let b = a; a = 2; console.log(b); // → 1 // Mutation
基本上我想做的是发送一个字符串列表 ex: ["aa","bb","vv"] 到 graphql Mutation 字段中,目前这是我的 Mutation Schema "listTest": &gr
使用 dplyr 进行组均值居中的有效/首选方法是什么,即获取组中的每个元素(mutate)并对其执行操作和汇总统计信息(该组的总结)。以下是使用基本 R 以 mtcars 为中心的组均值: do.c
pcd % arrange(tripNo, procDate, delay) %>% group_by(tripNo) %>% mutate(delayErr = (row_number(
我想知道查询类型后面的字符串有什么意义,在这种情况下是“ProvisionQueues”,似乎从字符串中删除它不会影响任何东西——它只是用于日志记录还是什么。元数据? mutation Provisi
所以,我正在尝试设计我的 Apollo 服务器。我想用一个对象作为参数来创建一个突变。 这是我的架构的一个片段,它以某种方式导致了问题: 我认为它在语法上是正确的,但我遇到了这个错误: {"error
CREATE OR REPLACE TRIGGER UPDATE_TEST_280510 AFTER insert on TEST_TRNCOMPVISIT declare V_TRNCOMPNO N
我有以下带有查询和突变的组件,但我的组件没有收到数据和突变 prop。 我的代码是不是做错了什么或遗漏了什么?虽然查询确实得到执行,但它没有传递下去。 this.props.mutate 和 this
我用 Go 编写了一个客户端应用程序,它需要与服务器端的 C 程序进行交互。客户端执行 AES CFB 加密,服务器解密。不幸的是,服务器端存在重用初始化向量的错误。它尝试根据以下条件进行 3 次解密
我的前端是 localhost:3000 ,我的 GraphQL 服务器是 localhost:3333 . 我已经使用 react-apollo 在 JSX 领域中查询/变异,但还没有从 Expre
我试图改变通常情况下来自 kube-scheduler 的资源“绑定(bind)”。 以下是我的“ValidatingWebhookConfiguration”yaml: apiVersion: ad
如所述here , 这是一个 reference implementation用于 kubernetes e2e 测试的 webhook 服务器。在 main 函数中,定义了一些端点来处理不同的突变请
我是一名优秀的程序员,十分优秀!