- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在审阅大数据类(class)的幻灯片。他们说高维朴素贝叶斯容易出现数值下溢和未观察到的事件 - 因此您应该在计算朴素贝叶斯时取概率的对数。这些幻灯片在谈论什么?我认为数字下溢会因为变量类型(例如,将 big 转换为 int)而失去精度。但这似乎不是这些幻灯片中该术语的含义。数字下溢和未观察到的事件是什么意思?在朴素贝叶斯中,取概率对数如何避免这些事情?
最佳答案
您的计算机的精度有限。例如,在一台以无限精度计算事物的理想计算机上,这个小 Python 程序永远不会停止,它只会不断打印越来越接近 0 的数字。
x = 1.0
while x != 0:
x = x * .5
print x
但是由于计算机以固定数量的位数存储数字,因此它只能表示有限的数字,最终它将乘积舍入为 0 并退出循环。
当你有很多特征时,朴素贝叶斯的计算会像这样发生。你将很多很多小于 1 的概率相乘,最终由于机器精度问题会达到 0。
关于machine-learning - 为什么高维贝叶斯分类问题会出现数值下溢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19371910/
我开始研究应用于计算机视觉和情感计算的机器学习和贝叶斯推理。 如果我理解正确的话,之间有一个很大的讨论 经典信息架构、本体论、语义网络研究人员 以及机器学习和贝叶斯专家 我认为这通常被称为强人工智能与
我有一个 MS SQL Server 2008 数据库,用于存储提供食物的地方(咖啡馆、餐馆、小餐馆等)。在连接到该数据库的网站上,人们可以从 1 到 3 的等级对地点进行评分。 在网站上有一个页面,
我正在努力学习 pyMC 3,但遇到了一些麻烦。由于 pyMC3 的教程有限,我从 Bayesian Methods for Hackers 开始工作.我正在尝试将 pyMC 2 代码移植到 Baye
我是一名优秀的程序员,十分优秀!