gpt4 book ai didi

python - 多项式朴素贝叶斯参数 alpha 设置? scikit学习

转载 作者:太空狗 更新时间:2023-10-29 21:39:23 27 4
gpt4 key购买 nike

有谁知道在做朴素贝叶斯分类时如何设置alpha参数吗?

例如我首先使用词袋构建特征矩阵,矩阵的每个单元格都是词的计数,然后我使用 tf(term frequency) 对矩阵进行归一化。

但是当我使用朴素贝叶斯构建分类器模型时,我选择使用多项式 N.B(我认为这是正确的,而不是伯努利和高斯)。默认的 alpha 设置是 1.0(文档说它是拉普拉斯平滑,我不知道是什么)。

结果真的很糟糕,只有 21% 的召回率找到了正类(目标类)。但是当我设置 alpha = 0.0001(我随机选择)时,结果得到 95% 的召回率。

此外,我检查了多项式 N.B formula ,我认为这是因为 alpha 问题,因为如果我使用单词计数作为特征,alpha = 1 不会影响结果,但是,由于 tf 在 0-1 之间,alpha = 1 实际上是影响这个公式的结果。

我也测试了没有使用tf的结果,只使用了bag of words的计数,结果也是95%,那么,有谁知道如何设置alpha值吗?因为我必须使用 tf 作为特征矩阵。

谢谢。

最佳答案

在多项式朴素贝叶斯中,alpha 参数就是所谓的 hyperparameter ;即控制模型本身形式的参数。在大多数情况下,确定超参数最佳值的最佳方法是通过 grid search在可能的参数值上,使用 cross validation评估模型在每个值的数据上的性能。阅读以上链接,了解有关如何使用 scikit-learn 执行此操作的详细信息。

关于python - 多项式朴素贝叶斯参数 alpha 设置? scikit学习,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33830959/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com