gpt4 book ai didi

r - 如何从数据框中选择和绘制每小时平均值?

转载 作者:行者123 更新时间:2023-12-04 12:07:45 25 4
gpt4 key购买 nike

我有一个如下所示的 CSV 文件,其中“时间”是 UNIX 时间戳:

time,count
1300162432,5
1299849832,0
1300006132,1
1300245532,4
1299932932,1
1300089232,1
1299776632,9
1299703432,14
... and so on

我正在将它读入 R 并将时间列转换为 POSIXct,如下所示:

data <- read.csv(file="data.csv",head=TRUE,sep=",")
data[,1] <- as.POSIXct(data[,1], origin="1970-01-01")

到目前为止还不错,但现在我想构建一个直方图,每个 bin 对应于平均每小时计数。我坚持按小时选择然后计数。我查看了 ?POSIXt?cut.POSIXt,但如果答案就在那里,我没有看到它。

如有任何帮助,我们将不胜感激。

最佳答案

这是一种方法:

R> lines <- "time,count
1300162432,5
1299849832,0
1300006132,1
1300245532,4
1299932932,1
1300089232,1
1299776632,9
1299703432,14"
R> con <- textConnection(lines); df <- read.csv(con); close(con)
R> df$time <- as.POSIXct(df$time, origin="1970-01-01")
R> df$hour <- as.POSIXlt(df$time)$hour
R> df
time count hour
1 2011-03-15 05:13:52 5 5
2 2011-03-11 13:23:52 0 13
3 2011-03-13 09:48:52 1 9
4 2011-03-16 04:18:52 4 4
5 2011-03-12 12:28:52 1 12
6 2011-03-14 08:53:52 1 8
7 2011-03-10 17:03:52 9 17
8 2011-03-09 20:43:52 14 20
R> tapply(df$count, df$hour, FUN=mean)
4 5 8 9 12 13 17 20
4 5 1 1 1 0 9 14
R>

您的数据实际上在一天中的每个小时都没有多个条目,但这会在几个小时内取平均值,从 POSIX 时间戳中正确解析。您可以根据需要使用 TZ 信息进行调整。

关于r - 如何从数据框中选择和绘制每小时平均值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5356136/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com