gpt4 book ai didi

r - 使用聚合的数据帧子集的相关性

转载 作者:行者123 更新时间:2023-12-04 21:53:07 25 4
gpt4 key购买 nike

我有一个由行绑定(bind)许多数据帧组成的数据帧,每个数据帧都用一个唯一的键标识。我希望计算大数据帧的每个子集(使用唯一键)中列的相关系数。例如,使用 mtcars 数据我可能想要计算列之间的相关性 hpwt对于 cyl 列中的每个唯一值.我可以循环执行

data("mtcars")
for(i in c(4,6,8)){
temp = subset(mtcars,mtcars$cyl==i)
cor(temp$hp,temp$wt)
}

我认为聚合会更好,但这段代码不起作用:
data("mtcars")
aggregate(mtcars,by=mycars$cyl,cor)

最佳答案

你可以使用

 data("mtcars")
library(plyr)
ddply(mtcars, "cyl", function(x) cor(x$hp, x$wt))
这将数据拆分为 mtcars通过 cyl , 适用于每个子集 x函数 cor(x$hp, x$wt)然后聚合 data.frame 中每个子集的结果。
我强烈推荐 plyr包裹。它是我在 R 中使用最多的软件包之一。

编辑:根据要求,这里是 dplyr版本。不得不说我不是大佬 dplyr用户,但代码应该没问题。
library(dplyr)
mtcars %>% group_by(cyl) %>% summarise(V1=cor(hp, wt))

关于r - 使用聚合的数据帧子集的相关性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16181750/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com