gpt4 book ai didi

testing - 连续属性 - 朴素贝叶斯算法中的分布

转载 作者:行者123 更新时间:2023-11-28 21:32:42 25 4
gpt4 key购买 nike

我正在尝试通过在 MATLAB 中编写自己的代码来实现朴素贝叶斯算法。我很困惑为其中一个连续属性选择什么分布。它的值如下:

         MovieAge :
1
2
3
4
..
10
1
11
2
12
1
3
13
2
1
4
14
3
2
5
15
4
3
6
16
5
4
....
32
9
3
15

请让我知道此类数据使用哪个发行版?在我的测试集中,此属性将包含(有时)未包含在训练数据中的值。如何处理这个问题?谢谢15

最佳答案

喜欢@Ben的回答,从Histogram开始听起来不错。

我接受了您的输入,直方图如下所示:

enter image description here

将您的数据保存到名为 histdata 的文本文件中,每个值一行:

用于生成绘图的 Python 代码:

import matplotlib.pyplot as plt
data = []
for line in file('./histdata'):
data.append(int(line))

plt.hist(data, bins=10)
plt.xlabel('Movie Age')
plt.ylabel('Counts')
plt.show()

关于testing - 连续属性 - 朴素贝叶斯算法中的分布,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13648335/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com