- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
当我手头有经过训练的 SVM 模型时,如何对测试数据进行转换?我正在尝试模拟数学方程和经过训练的 SVM 模型(使用 RBF 内核)的 SVM 输出。我该怎么做?
在SVM中,使用的一些常见内核是:
这里xi和xj代表两个样本。现在,如果数据有 5 个样本,则此转换是否包括两个样本的所有组合以生成转换后的特征空间,例如 x1 和 x1、x1 和 x2、x1 和 x3、...、x4 和 x5、x5和 x5。
如果数据有两个特征,则 2 阶多项式变换会将输入变换为 3 维,正如她在幻灯片 15 http://www.robots.ox.ac.uk/~az/lectures/ml/lect3.pdf 中所解释的那样
现在如何使用 RBF 核找到类似的变换解释?我正在尝试编写一段代码来转换测试数据,以便我可以在其上应用经过训练的 SVM 模型。
最佳答案
这比那要复杂得多。简而言之 - 您不将数据直接映射到特征空间。您只需将点积更改为由内核导出的点积即可。当您使用多项式内核时,SVM“内部”会发生什么,每个点实际上(间接)转换为 O(d^p)
维空间(其中 d-输入数据维度,p-多项式核的次数)。从数学角度来看,您使用一些(通常未知的)投影 phi_K(x)
它具有 K(x, y) = <phi_K(x), phi_K(y)>
的属性,仅此而已。在 SVM 实现中,您不需要实际的数据表示(因为 phi_K(x)
通常很大,有时甚至是无限的,就像在 RBF 情况下一样),但它需要您的点与训练集的每个元素的点积向量。
因此,您所做的(在实现中,而不是从数学角度来看)是提供:
G
定义为G_ij = K(x_i, x_j)
哪里x_i
是第 i 个训练样本y
您将其作为点积向量 H
提供给 SVM这样H_i = K(y, x_i)
,又在哪里x_i
是你的训练点(事实上,你只需要支持向量的值,但许多实现,如 libsvm,实际上需要训练集大小的向量 - 如果 K(y, x_j)
不是训练,你可以简单地为 x_j
输入 0矢量)请记住,这与在上述表示的“顶部”训练线性 SVM 不同。这只是实现通常接受数据的一种方式,因为它们需要点积(函数)的定义,并且传递数字通常比传递函数更容易(但其中一些,如 scikit-learn SVC 模块,实际上接受函数作为内核参数)。
那么什么是RBF核呢?它实际上是从点到正态分布的函数空间的映射,其均值为训练点。那么点积就是这两个函数的乘积从 -inf 到 +inf 的积分。听起来很复杂?乍一看,这是一个非常好的技巧,值得理解!
关于machine-learning - 支持向量机: Feature Transformation,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35290574/
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
我刚刚开始使用 Arduino,对更多高级内容几乎一无所知。这看起来很简单。现在我是一个通常喜欢将两个设备集成在一起的人,所以我想知道我是否可以使用计算机的键盘或连接到 Arduino 板上的两个硬件
Hadoop上是否有支持 vector 机的实现? 我正在寻找使我能够训练然后在Hadoop之上测试SVM模型的代码。 最佳答案 有人正在使用BSP在Apache Hama之上进行实现,该实现基本上是
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
我想用 Java 编写一个“智能监视器”,它会在它检测到即将出现的性能问题时发出警报。我的 Java 应用正在将结构化格式的数据写入日志文件: | | 因此,例如,如果我有一个执行时间为 812
我在 Cappuccino 中遇到这种错误 TypeError: Result of expression '_2b' [undefined] is not an object. TypeError:
我想编写一个简单的 bean 机程序。该程序将接受用户输入的球数和槽数,并计算每个球的路径。每个槽中的球数也将打印为直方图。 我尽力让代码保持简短和简洁,但我能做到的最好的长度是 112 行。当我运行
我正在开发一个 Plone 模板。目前我正在对模板实现搜索。模板上有一个表单提交到同一模板,即同一页面。 我需要启用页面的某些部分,即结果 DIV,仅当页面中的表单已提交时。我不确定如何检查页面是否已
我是机器学习的新手。我正在使用 opencv 开源库做一个项目。我的问题是我没有机器学习方面的经验。我从不同的图像中提取了特征并对其进行了评估,现在我想使用 SVM 对这些图像中的对象进行分类,但我不
我有一个来自自定义抽象对象的数据集和一个自定义距离函数。是否有任何好的 SVM 库允许我训练我的自定义对象(不是 2d 点)和我的自定义距离函数? 我在 this similar stackoverf
我正在尝试编写 SVM 或 KNN 程序来对文本文档进行分类。我掌握了两者的概念,但我希望看到一些很好的代码示例,它们专门演示了如何将文本/单词表示为 vector 。有人知道好的教程/文章/讲座/任
我想知道支持 vector 机 (SVM) 对于大型/超大型数据集(5-15M+ 行)具有非线性决策边界(例如高斯核)? 我知道两种特殊的方法:一方面,这个使用随机梯度下降等的调查: http://c
我试图在 Raspberry Pi 中使用 python 控制连续伺服(DF15RSMG),但连续伺服无法停止。代码如下: import RPi.GPIO as GPIO import time
我们在 .net 中有银行项目。在那个项目中我们需要实现存折打印。 - 存折背面会有磁条。 - 当客户将存折插入自助服务终端时,自助服务终端将生成 ISO 8583 信息。 - 为响应此消息,CBS(
我想使用 svm 分类器进行面部表情检测。我知道 opencv 有一个 svm api,但我不知道训练分类器的输入应该是什么。到现在看了很多论文,都是说人脸特征检测后训练分类器。 到目前为止我做了什么
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
为了学习 ArchLinux,我在 VirtualBox 机器上安装并使用了 ArchLinux。它运行完美。现在我在我的电脑上安装了 Docker(Windows 环境)。在安装 Docker 的过
我找不到很多相关信息,但是我知道可以通过命令提示符electron-packager .创建一个 Electron 应用。但是,可以通过 Node 快速路由在前端执行它吗? 所以我想做这样的事情: r
我正在使用 MS Visual Studio 2008、OpenCV、C++ 和 SVM 继续我的 OCR 项目。我生成了一个超过 2000 个机印字符样本的数据集。当我用线性核测试时,我总是得到 9
我通过UART接口(interface)(RX-TX,GND-GND)将伺服(TowerPro sg90)连接到32伺服 Controller (this one)。 卖家提供了如何连接和控制我的伺服
我是一名优秀的程序员,十分优秀!