- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。
想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。
6 个月前关闭。
Improve this question
我发现很难理解朴素贝叶斯的过程,我想知道是否有人可以用英语用一个简单的分步过程来解释它。我知道它需要按发生的时间进行比较作为概率,但我不知道训练数据与实际数据集是如何相关的。
请给我解释一下训练集所起的作用。我在这里举了一个非常简单的水果例子,例如香蕉
training set---
round-red
round-orange
oblong-yellow
round-red
dataset----
round-red
round-orange
round-red
round-orange
oblong-yellow
round-red
round-orange
oblong-yellow
oblong-yellow
round-red
最佳答案
据我了解,您的问题分为两部分,第一部分是您需要更好地理解朴素贝叶斯分类器,第二部分是围绕训练集的困惑。
一般来说,所有机器学习算法都需要针对分类、预测等监督学习任务或聚类等无监督学习任务进行训练。
在训练步骤中,算法使用特定的输入数据集(训练集)进行教授,以便稍后我们可以测试它们是否存在未知输入(它们以前从未见过),它们可以对其进行分类或预测等(在有监督的情况下)学习)基于他们的学习。这是大多数机器学习技术(如神经网络、SVM、贝叶斯等)的基础。
因此,在一般的机器学习项目中,基本上您必须将输入集划分为开发集(训练集 + 开发测试集)和测试集(或评估集)。请记住,您的基本目标是您的系统学习和分类他们以前从未在开发集或测试集中见过的新输入。
测试集通常与训练集具有相同的格式。然而,测试集与训练语料库不同是非常重要的:如果我们只是
重用训练集作为测试集,那么一个简单地记住其输入而不学习如何推广到新示例的模型将获得误导性的高分。
一般来说,例如,我们 70% 的数据可以用作训练集案例。还要记住将原始集随机划分为训练集和测试集。
现在我来回答你关于朴素贝叶斯的另一个问题。
为了演示朴素贝叶斯分类的概念,请考虑下面给出的示例:
如上所述,对象可以分类为 GREEN
或 RED
.我们的任务是在新案例到达时对其进行分类,即根据当前存在的对象决定它们属于哪个类标签。
由于GREEN
的数量是原来的两倍对象为 RED
,有理由相信一个新案例(尚未观察到)拥有成员资格的可能性是其他人的两倍 GREEN
而不是 RED
.在贝叶斯分析中,这种信念被称为先验概率。先验概率基于以前的经验,在这种情况下是 GREEN
的百分比。和 RED
对象,通常用于在结果实际发生之前预测结果。
因此,我们可以写:
GREEN
的先验概率 :number of GREEN objects / total number of objects
RED
的先验概率 :number of RED objects / total number of objects
由于一共有60
对象,40
其中是GREEN
和 20 RED
,我们的类成员资格的先验概率是:
GREEN
的先验概率 :40 / 60
RED
的先验概率 :20 / 60
制定我们的先验概率后,我们现在准备对新对象进行分类(下图中的 WHITE
圆圈)。由于对象聚类良好,因此可以合理地假设 GREEN
越多 | (或 RED
)X 附近的对象,新案例属于该特定颜色的可能性越大。为了衡量这种可能性,我们在 X 周围画了一个圆圈,其中包含许多(先验选择)点,而不管它们的类别标签如何。然后我们计算属于每个类标签的圆中的点数。由此我们计算似然:
从上图可以清楚地看出 X
的可能性给定 GREEN
小于 X
的可能性给定 RED
,因为圆圈包含 1
GREEN
对象和 3
RED
那些。因此:
尽管先验概率表明 X
可能属于 GREEN
(假设 GREEN
与 RED
相比是两倍)可能性表示相反;类(class)成员(member)X
是 RED
(假设 RED
附近的物体 X
比 GREEN
多)。在贝叶斯分析中,最终的分类是通过结合两个信息源,即先验和似然,使用所谓的贝叶斯规则(以 Rev. Thomas Bayes 1702-1761 命名)形成后验概率来产生的。
最后,我们将 X 分类为 RED
因为它的类成员达到了最大的后验概率。
关于algorithm - 朴素贝叶斯分类的简单解释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10059594/
我在一个项目中工作,该项目需要 SQL 结果的最佳性能,并且希望优化查询,但经过反复试验后,我在 IN 方面遇到了一些问题。 -- THIS RETURNS NO RESULTS AT ALL. SE
在尝试创建一个实际上非常简单的 SQL 语句时,我发现自己迷失了方向。 我有一个包含 3 个表的数据库: 食谱 - 存储一些用于 cooking 的食谱名称 配料食谱 - 将配料与食谱链接 成分 -
我正在尝试理解 PHP 中的 Hebrev 函数。 https://php.net/manual/en/function.hebrevc.php 它说:“将逻辑希伯来语文本转换为视觉文本”。但我不明白
嗨,我在 Grid view 的 android 文档中发现了一段代码对于以下代码。 gridview.setOnItemClickListener(new OnItemClickListener()
谁能解释一下 InfiniBand 是什么?与以太网相比的主要区别是什么,这些差异如何使其比以太网更快? 在官方description从 mellanox 写到 Introduce InfiniBan
这个问题已经有答案了: How are java increment statements evaluated in complex expressions (1 个回答) 已关闭 8 年前。 我知道
我正在阅读 MySQL 教程,我遇到了这个: SELECT /*! SQL_NO_CACHE */ user FROM users; 为什么优化提示 SQL_NO_CACHE 包含在: /*!
我无法理解$(this),我做了一个剪刀石头布的版本,并应用了 jQuery 让用户在计算机上选择按钮选项。我希望有人能解释一下 $(this) 指的是什么,它是 btn-primary 吗?该函数在
我不是很确定 while(choice == 1 || choice ==2);谁能解释一下。我明白这一点 if(choice ==1) displayMonthly(rainfall); e
let flyRight = CABasicAnimation(keyPath: "position.x") flyRight.toValue = view.bounds.size.width/2 f
目录 解释:int型默认值为0 但我们尝试发现并不能通过: 原因: int的默认值为0,而Integer的默认值为null
我正在处理一个查询,自从一个 SSRS 服务器传输到另一个服务器后,它似乎没有按预期执行,并且 where 语句的一部分中出现了以下行 找出不同之处,或者至少从我能找到的地方来看。 where COA
我正在制作一个退回检测程序,读取退回邮件。我们的设置是发送电子邮件,在发送的邮件中添加一个 noreply@domain.tl。一些收件人不再存在,因此我们想要读取退回邮件,并检测它发送给谁。我已经崩
我有一个关于公式通过控制点弯曲的问题。 如您所知,HTML Canvas 有 quadraticCurveTo(x1, y1, x2, y2)与 x1 and x2作为控制点。 但是,当您尝试使用它绘
我有一个 Emakefile看起来像: %% -- %% %% -- {'/Users/user/projects/custom_test/trunk/*', [debug_info, {out
我有一个非常简单的问题。这不仅适用于 spray-json,而且我已经阅读了 argonaut 和 circe 的类似声明。所以请赐教。 在 spray-json 中,我遇到了 There is no
我正在为视频添加水印。我试图让水印与视频尺寸成比例。我已经使用 scale2ref 看到了十几个不同的答案,但没有解释实际发生了什么,所以我发现很难知道如何实现/更改配置以适应我的情况。 当前覆盖命令
因为我正在学习语言,所以我在玩 Haskell,我只是发现了一些我不理解的东西,我找不到解释。如果我尝试运行此代码: map (`div` 0) [1,2,3,4] 我得到一个除以 0 的异常,这是预
我正在寻找解决错误对象引用未设置到对象实例的步骤/指南。以及问题发生原因的解释。 我正在寻找更一般的解释,所以如果我收到错误,我应该采取什么步骤来查找问题。我经常看到有人提供特定代码段的帖子,而其他人
我最近想升级我的知识React ,所以我从组件生命周期方法开始。让我好奇的第一件事是这个componentWillReceiveProps .所以,文档说当组件接收新的(不一定是更新的) Prop 时
我是一名优秀的程序员,十分优秀!