gpt4 book ai didi

python - 三种朴素贝叶斯分类器的区别

转载 作者:行者123 更新时间:2023-11-30 09:24:43 25 4
gpt4 key购买 nike

对于一些语法错误和用词不当,我们深表歉意。

我目前正在研究文本分类,尝试对电子邮件进行分类。

经过研究,我发现多项式朴素贝叶斯和伯努利朴素贝叶斯更常用于文本分类。伯努利只关心这个词是否发生。多项式关心的是单词出现的次数。

对于高斯朴素贝叶斯,通常用于连续数据和正态分布的数据,例如:高度、体重但是我们不使用高斯朴素贝叶斯进行文本分类的原因是什么?如果我们把它应用到文本分类中会发生什么不好的事情吗?

最佳答案

我们使用基于我们拥有的数据集类型的算法 -

伯努利朴素贝叶斯擅长处理 bool /二元属性,而多项式朴素贝叶斯擅长处理离散值和高斯朴素贝叶斯擅长处理连续值。

考虑三种情况:

  1. 考虑一个包含 has_diabeteshas_bphas_thyroth 等列的数据集,然后将人员分类为健康或不健康。在这种情况下,伯努利 NB 会很好地工作。

  2. 考虑一个数据集,其中包含不同学科的不同学生的分数,并且您想要预测该学生是否聪明。那么在这种情况下多项式 NB 就可以正常工作。

  3. 考虑一个包含学生体重的数据集,并且您要预测他们的高度,那么 GaussiaNB 在这种情况下效果很好。

关于python - 三种朴素贝叶斯分类器的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48580762/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com