gpt4 book ai didi

python - 如何选择与数据框中某一特定列高度相关的列

转载 作者:行者123 更新时间:2023-11-28 22:19:47 24 4
gpt4 key购买 nike

我有一个包含 100 多列的数据框,我试图用它来构建模型。在这种情况下,此数据框中的一列 (A) 被视为响应,所有其他列(B、C、D 等)都是预测变量。因此,我试图根据相关系数(比如 >0.2)选择与 A 列相关的所有列。我已经生成了一个热图,其中包含每对列之间的所有相关因子。但是我可以在 pandas 中有一个快速的方法来将所有相关因子超过 0.2 的列(当然如果需要我会调整)到 A 列吗?提前致谢!

最佳答案

使用 DataFrame 计算相关性,然后使用 bool 掩码根据您的截止条件对列进行切片。

import pandas as pd
df = pd.DataFrame({'A': [1,2,3,4,5,6,7,8,9,10],
'B': [1,2,4,3,5,7,6,8,10,11],
'C': [15,-1,17,-10,-10,-13,-99,-101,0,0],
'D': [0,10,0,0,-10,0,0,-10,0,10]} )

df.loc[:, df.corr()['A'] > 0.2]

A B
0 1 1
1 2 2
2 3 4
3 4 3
4 5 5
5 6 7
6 7 6
7 8 8
8 9 10
9 10 11

关于python - 如何选择与数据框中某一特定列高度相关的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49467553/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com