gpt4 book ai didi

python - 如果索引和列相同,如何在单独的列中获取数据集的相关值

转载 作者:行者123 更新时间:2023-12-01 07:52:19 25 4
gpt4 key购买 nike

我将一个数据集导入到我的 python 脚本中并获取了相关性。这是关联代码:

data = pd.read_excel('RQ_ID_Grouping.xlsx' , 'Sheet1')
corr = data.corr()

关联后的数据如下所示:

enter image description here

我想将数据转换为以下格式:

enter image description here

我正在使用此代码来实现上述数据,但它似乎不起作用:

corr1 = (corr.melt(var_name = 'X' , value_name = 'Y').groupby('X')['Y'].reset_index(name = 'Corr_Value'))

我知道“groupby”部分之后应该有一些东西,但我不知道是什么。如果您能帮助我,我将不胜感激。

最佳答案

使用DataFrame.stack要 reshape 并删除缺失值,请按 DataFrame.reset_indexMultiIndex 转换为列和最后设置的列名称:

df = corr.stack().reset_index()
df.columns = ['X','Y','Corr_Value']

另一个解决方案 DataFrame.rename_axis :

df = corr.stack().rename_axis(('X','Y')).reset_index(name='Corr_Value')

并且您使用 melt 的解决方案也是可能的:

df = (corr.rename_axis('X')
.reset_index()
.melt('X', var_name='Y', value_name='Corr_Value')
.dropna()
.sort_values(['X','Y'])
.reset_index(drop=True))

关于python - 如果索引和列相同,如何在单独的列中获取数据集的相关值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56148816/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com