gpt4 book ai didi

python-3.x - 打印相关性大于 80% 的列

转载 作者:行者123 更新时间:2023-12-04 10:11:07 24 4
gpt4 key购买 nike

我有一个大小为 235607 records 的 Pandas 数据框, 和 94 attributes .我很新 python我能够在所有属性之间创建一个相关矩阵,但要单独查看很多。我尝试编写一个 for 循环来打印相关性大于 80% 的列的列表,但我不断收到错误“'DataFrame' 对象没有属性 'c1'”

这是我用来创建属性之间相关性以及循环示例的代码。预先感谢您的帮助 :-

corr = data.corr() # data is the pandas dataframe
c1 = corr.abs().unstack()
c1.sort_values(ascending = False)
drop = [cols for cols in upper.c1 if any (upper[c1] > 0.80)]
drop

最佳答案

您可以简单地使用 numpy.where像这样:

corr.loc[np.where(corr>0.8, 1, 0)==1].columns

输出将是列名的数组,列名的值大于 0.8 .

编辑:我希望这会奏效。我编辑了上面的代码。

关于python-3.x - 打印相关性大于 80% 的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61329582/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com