gpt4 book ai didi

python - 如何指定 scikit-learn 的朴素贝叶斯的先验概率

转载 作者:太空宇宙 更新时间:2023-11-03 12:07:29 27 4
gpt4 key购买 nike

我将 scikit-learn 机器学习库 (Python) 用于机器学习项目。我使用的算法之一是高斯朴素贝叶斯实现。 GaussianNB() 函数的属性之一如下:

class_prior_ : array, shape (n_classes,)

我想先手动更改类(class),因为我使用的数据非常倾斜,并且记忆其中一个类(class)非常重要。通过为该类别分配高先验概率,召回率应该会增加。

但是,我不知道如何正确设置该属性。我已经阅读了以下主题,但他们的答案对我不起作用。

How can the prior probabilities manually set for the Naive Bayes clf in scikit-learn?

How do I know what prior's I'm giving to sci-kit learn? (Naive-bayes classifiers.)

这是我的代码:

gnb = GaussianNB()
gnb.class_prior_ = [0.1, 0.9]
gnb.fit(data.XTrain, yTrain)
yPredicted = gnb.predict(data.XTest)

我认为这是正确的语法,我可以通过使用值找出哪个类属于数组中的哪个位置,但结果保持不变。也没有给出错误。

从 scikit-learn 库中设置 GaussianNB 算法属性的正确方法是什么?

Link to the scikit documentation of GaussianNB

最佳答案

@Jianxun Li:其实在GaussianNB中是有设置先验概率的方法的。它称为“先验”,可作为参数使用。请参阅文档:“参数:先验:类似数组,形状(n_classes,) 类的先验概率。如果指定,则不会根据数据调整先验。”那么让我举个例子:

from sklearn.naive_bayes import GaussianNB
# minimal dataset
X = [[1, 0], [1, 0], [0, 1]]
y = [0, 0, 1]
# use empirical prior, learned from y
mn = GaussianNB()
print mn.fit(X,y).predict([1,1])
print mn.class_prior_

>>>[0]
>>>[ 0.66666667 0.33333333]

但是如果你改变了先验概率,它会给出一个不同的答案,我相信这就是你正在寻找的。

# use custom prior to make 1 more likely
mn = GaussianNB(priors=[0.1, 0.9])
mn.fit(X,y).predict([1,1])
>>>>array([1])

关于python - 如何指定 scikit-learn 的朴素贝叶斯的先验概率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25248583/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com