- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在阅读A Tutorial on Energy Based Learning我试图理解 SVM 上下文中上述所有术语之间的区别。这个link总结了损失、成本和目标函数之间的差异。根据我的理解,
目标函数:我们想要最小化的东西。例如,SVM 的 ||w||^2
。
损失函数:预测和标签之间的惩罚,也相当于正则化项。示例是 SVM 中的铰链损失函数。
成本函数:结合了目标函数和损失函数的通用公式。
现在,第一个链接指出铰链函数是 max(0, m + E(W,Yi,Xi) - E(W,Y,X))
即它是一个函数的能量项。这是否意味着 SVM 的能量函数是 1 - y(wx + b) ?能量函数是损失函数的一部分吗?损失+目标函数是成本函数的一部分?
对这 4 个术语的简洁总结将极大地帮助我的理解。另外,如果我的理解有误,请指正。这些术语听起来很困惑。谢谢!
最佳答案
Objective function: Something we want to minimize. For example ||w||^2 for SVM.
目标函数 - 顾名思义 - 优化目标。它可以是我们想要最小化(如成本函数)或最大化(如可能性)的东西。一般来说 - 衡量我们当前解决方案有多好的函数(通常通过返回一个实数)
Loss function: Penalty between prediction and label which is also equivalent to the regularization term. Example is the hinge loss function in SVM.
首先,从任何意义上来说,损失都不等于正则化。损失函数是模型和真实值之间的惩罚。这可以是类条件分布与真实标签的预测,因此也可以是数据分布与经验样本的预测,等等。
Regularization
正则化是一个术语、惩罚、措施,应该是对过于复杂的模型的惩罚。在机器学习中,或者通常在统计学中,当处理估计器时,您总是尝试平衡两个误差源:方差(来自过于复杂的模型、过度拟合)和偏差(来自过于简单的模型、糟糕的学习方法、拟合不足)。正则化是一种在优化过程中惩罚高方差模型的技术,以减少过度拟合的情况。换句话说 - 对于能够完美适应训练集的技术,重要的是要有一种禁止它的措施,以保持泛化能力。
Cost function: A general formulation that combines the objective and loss function.
成本函数只是一个最小化的目标函数。它可以由损失函数和正则化器的一些聚集组成。
Now, the 1st link states that the hinge function is max(0, m + E(W,Yi,Xi) - E(W,Y,X)) i.e. it is a function of the energy term. Does that mean that the energy function of the SVM is 1 - y(wx + b) ? Are energy functions are a part of a loss function. And a loss + objective function a part of the cost function ?
铰链损耗为max(0, 1 - y(<w,x> - b))
。这里定义的并不是真正针对 SVM 的,而是针对一般因子图的,我强烈建议从基础知识开始学习 ML,而不是从高级技术开始。如果没有很好地理解机器学习的基础知识,就不可能理解本文。
展示 SVM 和命名约定的示例
C SUM_i=1^N max(0, 1 - y_i(<w, x_i> - b)) + ||w||^2
\__________________________/ \_____/
loss regularization
\_________________________________________________/
cost / objective function
关于machine-learning - SVM - 能量与损失、正则化与成本函数之间的差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37511274/
我是 python 的新手。我试图找到我的文本的频率分布。这是代码, import nltk nltk.download() import os os.getcwd() text_file=open(
我对安卓 fragment 感到困惑。我知道内存 fragment 但无法理解什么是 android fragment 问题。虽然我发现很多定义,比如 Android fragmentation re
尝试对 WordPress 进行 dockerise 我发现了这个场景: 2个数据卷容器,一个用于数据库(bbdd),另一个用于wordpress文件(wordpress): sudo docker
这个问题已经有答案了: From the server is there a way to know that my page is being loaded in an Iframe (1 个回答)
我正在玩小型服务器,试图对运行在其上的服务进行docker化。为简化起见,假设我必须主要处理:Wordpress和另一项服务。 在Docker集线器上有许多用于Wordpress的图像,但是它们似乎都
我想要发生的是,当帐户成功创建后,提交的表单应该消失,并且应该出现一条消息(取决于注册的状态)。 如果成功,他们应该会看到一个简单的“谢谢。请检查您的电子邮件。” 如果不是,那么他们应该会看到一条适当
就是这样,我需要为客户添加一个唯一标识符。通过 strip 元数据。这就是我现在完全构建它的方式,但是我只有最后一部分告诉我用户购买了哪个包。 我试着看这里: Plans to stripe 代码在这
我有一个类将执行一些复杂的操作,涉及像这样的一些计算: public class ComplexAction { public void someAction(String parameter
这个问题已经有答案了: maven add a local classes directory to module's classpath (1 个回答) 已关闭10 年前。 我有一些不应更改的旧 E
我使用 fragment 已经有一段时间了,但我经常遇到一个让我烦恼的问题。 fragment 有时会相互吸引。现在,我设法为此隔离了一个用例,它是这样的: Add fragment A(也使用 ad
我的 html 中有一个 ol 列表,上面有行条纹。看起来行条纹是从数字后面开始的。有没有办法让行条纹从数字开始? 我已经包含了正在发生的事情的片段 h4:nth-child(even) {
如何仅使用 css 将附加图像 html 化? 如果用纯 css 做不到,那我怎么能至少用一个图像来做 最佳答案 这不是真正的问题,而是您希望我们为您编写代码。我建议您搜索“css breadcrum
以下是 Joshua 的 Effective Java 的摘录: If you do synchronize your class internally, you can use various te
在这里工作时,我们有一个框向业务合作伙伴提供 XML 提要。对我们的提要的请求是通过指定查询字符串参数和值来定制的。其中一些参数是必需的,但很多不是。 例如,我们要求所有请求都指定一个 GUID 来标
我有 3 个缓冲区,其中包含在 32 位处理器上运行的 R、G、B 位数据。 我需要按以下方式组合三个字节: R[0] = 0b r1r2r3r4r5r6r7r8 G[0] = 0b g1g2g3g4
我最近发现了关于如何使用 History.js、jQuery 和 ScrollTo 通过 HTML5 History API 对网站进行 Ajax 化的要点:https://github.com/br
我们有一个 Spring Boot 应用程序,由于集成需要,它变得越来越复杂——比如在你这样做之后发送一封电子邮件,或者在你之后广播一条 jms 消息等等。在寻找一些更高级别的抽象时,我遇到了 apa
我正在尝试首次实施Google Pay。我面临如何指定gateway和gatewayMarchantId的挑战。 我所拥有的是google console帐户,不知道在哪里可以找到此信息。 priva
昨天下午 3 点左右,我为两个想要从一个 Azure 帐户转移到另一个帐户的网站设置了 awverify 记录。到当天结束时,Azure 仍然不允许我添加域,所以我赌了一把,将域和 www 子域重新指
我正在使用terms facet在elasticsearch服务器中获取顶级terms。现在,我的标签"indian-government"不被视为一个标签。将其视为"indian" "governm
我是一名优秀的程序员,十分优秀!