gpt4 book ai didi

r - 聚合时间序列时避免 for 循环

转载 作者:行者123 更新时间:2023-12-04 09:32:23 28 4
gpt4 key购买 nike

我明白为什么矢量化函数比 for 循环更好。

但是有些问题我看不到矢量化函数式编程解决方案。其中之一是汇总月度数据以获得季度数据。任何替换此代码的建议...

month <- 1:100
A422072L <- c(rep(NA, 4), rnorm(96, 100, 5) ) + 2 * month
A422070J <- c(NA, NA, rnorm(96, 100, 5), NA, NA) + 2 * month
Au.approvals <- data.frame(month=month, A422072L=A422072L, A422070J=A422070J)

Au.approvals$trend.sum.A422072L.qtr <- NA
Au.approvals$sa.sum.A422070J.qtr <- NA
for(i in seq_len(nrow(Au.approvals)))
{
if(i < 3) next
if(all(!is.na(Au.approvals$A422072L[(i-2):i])))
Au.approvals$trend.sum.A422072L.qtr[i] <- sum(Au.approvals$A422072L[(i-2):i])
if(all(!is.na(Au.approvals$A422070J[(i-2):i])))
Au.approvals$sa.sum.A422070J.qtr[i] <- sum(Au.approvals$A422070J[(i-2):i])
}

print(Au.approvals)

现在有足够的数据可以作为示例运行。

最佳答案

让我们创建一些虚假的时间序列:

time_dat = data.frame(t = 1:100, value = runif(100))

要获得滚动总和,请查看 zoo 包中的 rollapply:

require(zoo)
time_dat = transform(time_dat,
roll_value = rollapply(value, 10, sum, fill = TRUE))

这里我假设较粗的分辨率(季度)比较精细的分辨率粗 10 倍。


非滚动平均值的原始答案:

我喜欢使用 plyr 包中的函数,但是 aveaggregatedata.table 也是不错的选择。对于大型数据集,data.table 非常快。但是回到一些 plyr 魔法:

首先创建一个额外的列,指定更粗略的时间频率,即您在哪个季度观察:

time_dat[["coarse_t"]] = rep(1:10, each = 10)
> head(time_dat)
t value coarse_t
1 1 0.9045097 1
2 2 0.4174182 1
3 3 0.5638139 1
4 4 0.8228698 1
5 5 0.7059027 1
6 6 0.5285386 1

现在我们可以聚合 time_dat 以获得更粗略的时间频率:

time_dat_coarse = ddply(time_dat, .(coarse_t), summarise, sum_value = sum(value))
> time_dat_coarse
coarse_t sum_value
1 1 6.097348
2 2 4.834720
3 3 3.988809
4 4 4.170656
5 5 4.538269
6 6 6.198716
7 7 4.399282
8 8 5.507384
9 9 6.089072
10 10 4.663287

关于r - 聚合时间序列时避免 for 循环,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12949683/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com