gpt4 book ai didi

r - 如何计算大型数据集的平均值

转载 作者:行者123 更新时间:2023-12-03 04:54:57 24 4
gpt4 key购买 nike

我正在使用一个数据集,该数据集每天 24 小时每小时读取一次温度读数,已有 100 多年的历史。我想获得每天的平均温度以减少数据集的大小。标题如下所示:

     YR MO DA HR MN TEMP
1943 6 19 10 0 73
1943 6 19 11 0 72
1943 6 19 12 0 76
1943 6 19 13 0 78
1943 6 19 14 0 81
1943 6 19 15 0 85
1943 6 19 16 0 85
1943 6 19 17 0 86
1943 6 19 18 0 86
1943 6 19 19 0 87

等 600,000 多个数据点。

如何运行嵌套函数来计算日平均温度,以便保留 YR、MO、DA、TEMP?一旦有了这个,我希望能够查看长期平均值并计算 30 年来 1 月份的平均气温。我该怎么做?

最佳答案

您只需一步即可完成此操作:

 meanTbl <- with(datfrm, tapply(TEMP, ISOdate(YR, MO, DA), mean) )

这将为您提供日期时间格式的索引以及值。如果您只想将日期作为字符而无需跟踪时间:

meanTbl <- with(dat, tapply(TEMP, as.Date(ISOdate(YR, MO, DA)), mean) )

每月平均值可以通过以下方式完成:

 monMeans <- with(meanTbl, tapply(TEMP, MO, mean))

关于r - 如何计算大型数据集的平均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15105670/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com