gpt4 book ai didi

python - 最重要的特征 高斯朴素贝叶斯分类器 python sklearn

转载 作者:行者123 更新时间:2023-12-03 17:31:23 26 4
gpt4 key购买 nike

我正在尝试为我的 GaussianNB 模型获取最重要的特征。来自这里的代码 How to get most informative features for scikit-learn classifiers?或在这里 How to get most informative features for scikit-learn classifier for different class?仅当我使用 MultinomialNB 时才有效。否则,我如何计算或检索我的两个类(Fault = 1 或 Fault = 0)中最重要的特征?
我的代码是:(不适用于文本数据)

df = df.toPandas()

X = X_df.values
Y = df['FAULT'].values.reshape(-1,1)


gnb = GaussianNB()
y_pred = gnb.fit(X, Y).predict(X)

print(confusion_matrix(Y, y_pred))
print(accuracy_score(Y, y_pred))

其中 X_df 是一个数据框,其中包含我的每个功能的二进制列。

最佳答案

这就是我试图理解高斯 NB 的重要特征的方式。 SKlearn Gaussian NB 模型,包含参数 theta 和 sigma,即每个类的每个特征的方差和均值(例如:如果是二元分类问题,则 model.sigma_ 将返回每个类的每个特征的两个数组和平均值) .

neg = model.theta_[0].argsort()
print(np.take(count_vect.get_feature_names(), neg[:10]))

print('')

neg = model.sigma_[0].argsort()
print(np.take(count_vect.get_feature_names(), neg[:10]))

这就是我尝试使用 scikit-learn 库中的高斯朴素贝叶斯来获取类的重要特征的方式。

关于python - 最重要的特征 高斯朴素贝叶斯分类器 python sklearn,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53506343/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com