gpt4 book ai didi

r - 数据框的多个变量之间的相关性

转载 作者:行者123 更新时间:2023-12-04 15:57:46 26 4
gpt4 key购买 nike

我有一个 data.frame R 中的 10 个变量.让我们调用他们 var1 var2 ... var10
我想找到 var1 之一的相关性关于var2 , var3 ... var10
我们怎么做?
cor函数可以一次找到两个变量之间的相关性。通过使用它,我不得不写 cor每个分析的函数

最佳答案

我的包裹corrr有助于探索相关性,对此有一个简单的解决方案。我将使用 mtcars 数据集作为示例,并说我们要关注 mpg 的相关性。与所有其他变量。

install.packages("corrr")  # though keep eye out for new version coming soon
library(corrr)
mtcars %>% correlate() %>% focus(mpg)


#> rowname mpg
#> <chr> <dbl>
#> 1 cyl -0.8521620
#> 2 disp -0.8475514
#> 3 hp -0.7761684
#> 4 drat 0.6811719
#> 5 wt -0.8676594
#> 6 qsec 0.4186840
#> 7 vs 0.6640389
#> 8 am 0.5998324
#> 9 gear 0.4802848
#> 10 carb -0.5509251

在这里, correlate()产生一个相关数据帧,和 focus()让您专注于某些变量与所有其他变量的相关性。

仅供引用, focus()select() 类似来自 dplyr包,除了它改变行和列。所以如果你熟悉 select() ,您应该会发现它很容易使用 focus() .例如。:
mtcars %>% correlate() %>% focus(mpg:drat)

#> rowname mpg cyl disp hp drat
#> <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 wt -0.8676594 0.7824958 0.8879799 0.6587479 -0.71244065
#> 2 qsec 0.4186840 -0.5912421 -0.4336979 -0.7082234 0.09120476
#> 3 vs 0.6640389 -0.8108118 -0.7104159 -0.7230967 0.44027846
#> 4 am 0.5998324 -0.5226070 -0.5912270 -0.2432043 0.71271113
#> 5 gear 0.4802848 -0.4926866 -0.5555692 -0.1257043 0.69961013
#> 6 carb -0.5509251 0.5269883 0.3949769 0.7498125 -0.09078980

关于r - 数据框的多个变量之间的相关性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38548943/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com