gpt4 book ai didi

python - 如何计算多变量 1 列的相关系数

转载 作者:太空宇宙 更新时间:2023-11-04 00:07:10 24 4
gpt4 key购买 nike

Category  SubCategory  Month  Value
A A1 Jan 1
A A1 Feb 2
A A1 Mar 3
A A2 Jan 2
A A2 Feb 3
A A2 Mar 5
B B1 Jan 1
B B1 Feb 6
B B1 Mar 7
B B2 Jan 3
B B2 Feb 6
B B2 Mar 7

我有一个这样的样本 pandas df。我想计算子组类别 A1 和 A2、B1 和 B2 之间的相关系数,但不是 A1 和 B1 等。我的最终目标是有一个这样的表:

    A1        A2        B1     B2
A1 1.0000 0.9820
A2 0.9820 1.0000
B1 1.0000 0.9963
B2 0.9963 1.0000

谁能帮我写 python 代码?

很明显,这个给了我每个子类别的 corr 值 1

df.groupby('SubCategory').corr()

最佳答案

第一个是pivot问题,然后就用corr

pd.concat([x.pivot('Month','SubCategory','Value').corr() for _,x in df.groupby('Category')])
A1 A2 B1 B2
SubCategory
A1 1.000000 0.981981 NaN NaN
A2 0.981981 1.000000 NaN NaN
B1 NaN NaN 1.000000 0.996271
B2 NaN NaN 0.996271 1.000000

关于python - 如何计算多变量 1 列的相关系数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53755029/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com