gpt4 book ai didi

r - 用 R 计算季节性平均值的最优雅方法是什么?

转载 作者:行者123 更新时间:2023-12-04 11:53:55 27 4
gpt4 key购买 nike

我将时间序列与每日平均观察数据均匀分布。

如何以最简单的方式计算季节性平均值?季节应遵循 DJF(= 冬季:12 月、1 月、2 月)、MAM、JJA 和 SON 的气象术语。

这意味着 12 月的值来自 x-1 年。

这里很好地介绍了月均值的计算:
How to calculate a monthly mean?

在计算季节性均值时可以遵循这个想法。但是,有几个警告使它不是很透明,必须小心!

我还在以前的帖子中处理了这个问题的一小部分:How to switch rows in R?

现在是完整的故事:

0: 制作一个随机时间序列

ts.pdsi <- data.frame(date = seq(
from=as.Date("1901-01-01"),
to=as.Date("2009-12-31"),
by="day"))
ts.pdsi$scPDSI <- rnorm(dim(ts.foo)[1], mean=1, sd=1) # add some data

第一名:使用 seas 包并将季节添加到您的时间序列中,该时间序列必须格式化为 data.frame。
library(seas)
# add moth/seasons
ts.pdsi$month <- mkseas(ts.pdsi,"mon") # add months
ts.pdsi$seas <- mkseas(ts.pdsi,"DJF") # add seasons
ts.pdsi$seasyear <- paste(format(ts.pdsi[,1],"%Y"),
ts.pdsi$seas ,sep="") # add seasyears, e.g. 1950DJF

这给
> head(ts.pdsi)
date scPDSI month seas seasyear
1 1901-01-01 -0.10881074 Jan DJF 1901DJF
2 1901-02-01 -0.22287750 Feb DJF 1901DJF
3 1901-03-01 -0.12233192 Mär MAM 1901MAM
4 1901-04-01 -0.04440915 Apr MAM 1901MAM
5 1901-05-01 -0.36334082 Mai MAM 1901MAM
6 1901-06-01 -0.52079030 Jun JJA 1901JJA

第二名:然后,您可以按照上述方法使用 $seasyear 列计算季节性平均值
> MEAN <- tapply(pdsi$scPDSI, ts.pdsi$seasyear, mean, na.rm = T)
> head(MEAN)
1901DJF 1901JJA 1901MAM 1901SON 1902DJF 1902JJA
-0.45451556 -0.72922229 -0.17669396 -1.12095590 -0.86523850 -0.04031273

注意: Spring (MAM) 和夏季 (JJA) 由于严格按字母排序而切换。

第三名:切换回来
foo <- MEAN
for(i in 1:length(MEAN)) {
if (mod (i,4) == 2) {
foo[i+1] <- foo[i] #switch 2nd 3rd row (JJA <-> MAM)
foo[i] <- MEAN[i+1]
}
}
# and generate new names for the array
d <- data.frame(date=seq(from=as.Date("1901-01-01"), to=as.Date("2009-12-31"), by="+3 month"))
d$seas <- mkseas(d,"DJF")
d$seasyear <- paste(format(d[,1],"%Y"), d$seas ,sep="")
names(foo)<-d$seasyear # add right order colnames
MEAN <-foo

最后,这会产生季节性均值的时间序列。好吧,我觉得它太复杂了,我想周围有更简单的解决方案。

此外,该解决方案还存在冬季 DJF 的一个重大问题:到目前为止,还没有从前一年中选择 12 月。这很容易修复(我猜),但使给定的方式更加复杂。

我真的希望周围有更好的想法!

最佳答案

我这是你想要的?

# # create some data: daily values for three years
df <- data.frame(date = seq(from = as.Date("2007-01-01"),
to = as.Date("2009-12-31"),
by = "day"))
df$vals <- rnorm(nrow(df))

# add year
df$year <- format(df$date, "%Y")

# add season
df$seas <- mkseas(x = df, width = "DJF")

# calculate mean per season within each year
df2 <- aggregate(vals ~ seas + year, data = df, mean)

df2
# seas year vals
# 1 DJF 2007 -0.048407610
# 2 MAM 2007 0.086996842
# 3 JJA 2007 0.013864555
# 4 SON 2007 -0.081323367
# 5 DJF 2008 0.170887946
# 6 MAM 2008 0.147830260
# 7 JJA 2008 0.003008866
# 8 SON 2008 -0.057974215
# 9 DJF 2009 -0.043437437
# 10 MAM 2009 -0.048345979
# 11 JJA 2009 0.023860506
# 12 SON 2009 -0.060076870

因为 mkseas将日期转换为具有所需顺序级别的季节性因素,在年份和季节聚合后顺序也是正确的。

关于r - 用 R 计算季节性平均值的最优雅方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18978256/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com