gpt4 book ai didi

R:处理 data.frame 中的连接和平均值的最佳函数是什么?

转载 作者:行者123 更新时间:2023-12-01 08:19:44 28 4
gpt4 key购买 nike

我有一个来自这段代码的 data.frame:

   my_df = data.frame("read_time" = c("2010-02-15", "2010-02-15", 
"2010-02-16", "2010-02-16",
"2010-02-16", "2010-02-17"),
"OD" = c(0.1, 0.2, 0.1, 0.2, 0.4, 0.5) )

产生这个:
> my_df
read_time OD
1 2010-02-15 0.1
2 2010-02-15 0.2
3 2010-02-16 0.1
4 2010-02-16 0.2
5 2010-02-16 0.4
6 2010-02-17 0.5

我想在每个不同的 read_time 上平均 OD 列(注意有些是复制的,有些不是),我还想计算标准偏差,生成这样的表:
> my_df
read_time OD stdev
1 2010-02-15 0.15 0.05
5 2010-02-16 0.3 0.1
6 2010-02-17 0.5 0

哪些是处理在 data.frame 中连接这些值的最佳函数?

最佳答案

plyr包为此很受欢迎,但基本功能 by()aggregate()也会有所帮助。

> ddply(my_df, "read_time", function(X) data.frame(OD=mean(X$OD),stdev=sd(X$OD)))
read_time OD stdev
1 2010-02-15 0.15000 0.07071
2 2010-02-16 0.23333 0.15275
3 2010-02-17 0.50000 NA

您可以添加缺少的位以返回 0 而不是最后一个 std.dev 的 NA。

此外,您不需要 data.frame 构造中的引号(在变量上)。

关于R:处理 data.frame 中的连接和平均值的最佳函数是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2473659/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com