gpt4 book ai didi

python-3.x - 如何计算所有特征与目标变量的相关性(二元分类器,python 3)?

转载 作者:行者123 更新时间:2023-12-04 01:46:21 24 4
gpt4 key购买 nike

我想在 python 中计算我的所有特征(所有浮点类型)和类标签(二进制,0 或 1)的相关性。此外,我想绘制数据以可视化它们按类别的分布。

这是必需的,这样我就可以找到与单个标签耦合的特征并找出它们的真正重要性。请注意,我不想要成对特征相关性并且我的分类器是二元的。

我已经尝试了以下内容(来自 stackoverflow 中的类似帖子),但这并不是我想要的。

df.drop("Target", axis=1).apply(lambda x: x.corr(df.Target)) 

请在所附图片中查看其中一个特征(来自 Weka)的分布情况。

其中一个特征的类分布 Class distribution for one of the features

非常感谢任何反馈。

最佳答案

相关性不应该用于分类变量。有关更多说明,请参阅 here

您可以通过以下方法了解自变量和目标变量之间的关系。

from sklearn.datasets import load_breast_cancer
data = load_breast_cancer(return_X_y=False)

import pandas as pd

df=pd.DataFrame(data.data[:,:5])
df.columns = data.feature_names[:5]

df['target'] = data.target.astype(str)

import seaborn as sns;
import matplotlib.pyplot as plt
g= sns.pairplot(df,hue = 'target', diag_kind= 'hist',
vars=df.columns[:-1],
plot_kws=dict(alpha=0.5),
diag_kws=dict(alpha=0.5))
plt.show()

enter image description here

关于python-3.x - 如何计算所有特征与目标变量的相关性(二元分类器,python 3)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55113349/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com