- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个由大约 1568 行组成的训练数据集,每行都有类属性的七个值之一。我正在寻求在 168 行的第二个数据集上测试此数据。
但是我有一个问题。 Weka 报告称“类先验”是:
141.0
169.0
225.0
197.0
421.0
281.0
141.0
我的训练集每个类属性值的实例数如下:
140
168
224
196
420
280
140
除了类先验与类属性每个值的训练集行数密切相关之外,谁能告诉我它们是什么以及它们实际代表什么?
测试集的每个类属性值有以下数量的实例:
15
18
24
21
45
30
15
最佳答案
类先验是对从总体中随机采样实例将产生给定类的概率的估计(无论实例的任何属性如何)。 Weka 假设您的训练数据是从总体中随机抽取的,这样训练集中的类别比例就表明了它们在抽样总体中的相对丰度。请注意,Weka 报告的不是先验,而是用于计算先验的计数。每个计数加 1 的原因是为了防止在训练数据中未表示特定类别的情况下出现零计数。因此,Weka 应该将每个类别的实际先验计算为
P(c_i) = n_i / (N + C)
其中 n_i
是类 i
的样本数,N
是样本总数,C
code> 是类的数量。
作为先验概率用途的一个非常简单的例子,考虑对疾病进行分类,只知道一个人发烧和头痛。这些症状是流感和埃博拉病毒的症状。但患流感的人数远多于埃博拉(流感的先验概率远高于埃博拉),因此根据这些症状,您可以将这种疾病归类为流感。
Weka 提供了更新或覆盖默认先验概率的方法。要了解如何在分类中使用先验概率的数学细节,请查看 Bayes' Theorem .
关于machine-learning - 类先验在 Weka 分类中的作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14523095/
我想创建一组参数用于 R 中的 brms 模型: library(brms) tmp <- prior(normal(10,2), nlpar = "x") 理想情况下,我想从导入的矩阵中提取每个先验
我想在 PyMC3 中指定大型多元正态分布作为先验。该分布的精度矩阵的行列式在数值上等于零。看来这是 PyMC3 的问题。有什么建议么?我只需要最大化后验,无论行列式的值如何,都可以这样做。 最佳答案
(未在 Activator 文档中找到) 通过在文件 build.sbt 中添加以下条目(粗体),似乎可以让 Activator 也使用现有的本地 Maven 存储库: 解析器 += Seq( 位于“
我之前实现了原始的 Bayesian Probabilistic Matrix Factorization (BPMF) pymc3 中的模型。 See my previous question供引用
我是一名优秀的程序员,十分优秀!