gpt4 book ai didi

python - pandas 数据框中两列的相关系数与 .corr()

转载 作者:行者123 更新时间:2023-12-03 15:13:56 25 4
gpt4 key购买 nike

我想在本质上创建列 bool 值后计算 Pandas 数据框的两列之间的相关系数。原版table有两列:一个 Group带有两个处理组之一的列,现在是 bool 值,还有一个 Age团体。这些是我要计算相关系数的两列。

我试过 .corr()方法,与:

table.corr(method='pearson')

但这是否还给我:
enter image description here

我粘贴了 bool 值 table 的前 25 行以下。我不知道我是否缺少参数,或者如何解释这个结果。同样奇怪的是它也是1。提前致谢!
    Group  Age
0 1 50
1 1 59
2 1 22
3 1 48
4 1 53
5 1 48
6 1 29
7 1 44
8 1 28
9 1 42
10 1 35
11 0 54
12 0 43
13 1 50
14 1 62
15 0 64
16 0 39
17 1 40
18 1 59
19 1 46
20 0 56
21 1 21
22 1 45
23 0 41
24 1 46
25 0 35

最佳答案

在整个 DataFrame 上调用 .corr() 会给你一个完整的相关矩阵:

>>> table.corr()
Group Age
Group 1.0000 -0.1533
Age -0.1533 1.0000

您可以改用单独的系列:
>>> table['Group'].corr(table['Age'])
-0.15330486289034567

这应该比使用完整矩阵和索引它(使用 df.corr().iat['Group', 'Age'] )更快。此外,无论 Group 是 bool 还是 int dtype,这都应该有效。

关于python - pandas 数据框中两列的相关系数与 .corr(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49350445/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com