- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
问候,
如何计算使用最近均值分类器对 IRIS 数据集进行分类需要执行多少次距离计算。
我知道 IRIS 数据集有 4 个特征,每条记录都根据 3 个不同的标签进行分类。
根据一些教科书,可以进行如下计算:
但是,我对这些不同的符号以及这个方程的含义感到困惑。例如,等式中的 s^2 是多少?
最佳答案
该表示法是大多数机器学习教科书的标准表示法。在这种情况下,s
是训练集的样本标准差。假设每个类别具有相同的标准差是很常见的,这就是为什么每个类别都被分配相同的值的原因。
但是你不应该关注这一点。最重要的一点是先验是否相等。这是一个公平的假设,意味着您期望数据集中每个类的分布大致相等。通过这样做,分类器简单地归结为找到从训练样本 x 到由其平均向量表示的每个其他类的最小距离。
如何计算这个非常简单。在您的训练集中,您有一组训练示例,每个示例都属于一个特定的类。对于 iris 数据集,您有三个类。您找到每个类的平均特征向量,它们将分别存储为 m1、m2
和 m3
。之后,要对新的特征向量进行分类,只需找到该向量到每个均值向量的最小距离即可。距离最小的一类就是您要分配的类别。
既然您选择了 MATLAB 作为语言,请允许我用实际的 iris 数据集进行演示。
load fisheriris; % Load iris dataset
[~,~,id] = unique(species); % Assign for each example a unique ID
means = zeros(3, 4); % Store the mean vectors for each class
for i = 1 : 3 % Find the mean vectors per class
means(i,:) = mean(meas(id == i, :), 1); % Find the mean vector for class 1
end
x = meas(10, :); % Choose a random row from the dataset
% Determine which class has the smallest distance and thus figure out the class
[~,c] = min(sum(bsxfun(@minus, x, means).^2, 2));
代码相当简单。加载数据集,由于标签位于元胞数组中,因此可以方便地创建一组新的标签(枚举为 1、2 和 3),以便轻松隔离每个类的训练示例并计算它们的平均向量。这就是 for
循环中发生的事情。完成后,我从训练集中选择一个随机数据点,然后计算从该点到每个平均向量的距离。我们选择距离最小的类别。
如果您想对整个数据集执行此操作,则可以,但这需要对维度进行一些排列才能实现。
data = permute(meas, [1 3 2]);
means_p = permute(means, [3 1 2]);
P = sum(bsxfun(@minus, data, means_p).^2, 3);
[~,c] = min(P, [], 2);
data
和 means_p
是以具有单一维度的 3D 矩阵的方式转换后的特征和均值向量。第三行代码计算矢量化的距离,以便最终生成一个二维矩阵,其中每行 i
计算从训练示例 i
到每个均值向量的距离。我们最终找到每个示例距离最小的类。
为了了解准确性,我们可以简单地计算正确分类的总次数的分数:
>> sum(c == id) / numel(id)
ans =
0.9267
使用这个简单的最近均值分类器,我们的准确率达到 92.67%...不错,但您可以做得更好。最后,要回答您的问题,您需要进行 K * d
距离计算,其中 K
是示例数量,d
是示例数量类。通过上面的逻辑和代码,你可以清楚地看到这是必需的。
关于matlab - 最近均值分类器的距离计算器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55310891/
我目前正在尝试使用 ParaView Calculator-Filter 将给定的笛卡尔坐标 (x,y,z) 转换为球坐标 (r, theta, phi),其中 theta 是极角,phi 是方位角。
已关闭。这个问题是 not reproducible or was caused by typos 。目前不接受答案。 这个问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-top
我有这个问题,我想显示如果0/0,输出是:“不能将0除以自身”。如何调整我的代码以便可以显示该输出?如果是这样,我应该使用什么代码才能实现我的目标? 下面是我的代码: #include using
我正在尝试创建一个也支持负数的计算器,并最终创建一个 lisp 风格的树。 我像这样定义词法分析器规则: INT :'-'? [0-9]+ ; LBRACKET : '('; RBRACKET :
我正在开发一个基本的 JavaScript 计算器,我也希望能够开始计算负数。现在,如果我在输入数字之前单击“-”,“-”将不会显示,因此我只能从正数开始。有人可以告诉我如何将其包含在我的代码中吗?
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
这是我第一次尝试 Java。该项目是一个计算器,它需要一个数字、一个运算符(operator)信号(+、-、*、/)和另一个数字来创建方程并给出其最终值,然后询问用户是否要重新启动程序另一个方程或不是
所以我写了这个脚本;它有点像我找到并拼凑起来的计算器的大杂烩。 KeyListener 来自 Java - oracle - .com 网站。顺便说一句,我对此非常陌生,不知道我在做什么。 我正在尝试
我正在尝试创建一个也支持负数的计算器,并最终创建一个 lisp 风格的树。 我像这样定义词法分析器规则: INT :'-'? [0-9]+ ; LBRACKET : '('; RBRACKET :
我正在开发一个基本的 JavaScript 计算器,我也希望能够开始计算负数。现在,如果我在输入数字之前单击“-”,“-”将不会显示,因此我只能从正数开始。有人可以告诉我如何将其包含在我的代码中吗?
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我开始在java中创建一个计算器,我试图循环遍历字符串输入,如果输入中有任何整数,则将它们添加到ArrayList calcOperands中。在 parseInput() 方法中,我使用 charA
我正忙着制作计算器,但不知怎的,整数没有被使用,我不知道为什么。我尝试修复它,但我不知道该怎么做。我使用带有事件的按钮来计算答案,也许有问题。这是我的代码:顺便说一句,我使用 Eclipse
我的主类中有这段代码。我的问题是,GPA 是用总分除以类(class)来计算的。它没有给我完整的号码。 EX,如果总数为 14,类(class)为 4,则为 3.5,我的代码只给我 3.0。有谁知道为
我需要创建一个可以加、减、乘、除、绝对值和舍入的计算器。这是我到目前为止所拥有的 import java.util.Scanner; public class Calculator { pub
我是一名 Java Noob,正在研究 GUI 计算器,但我刚刚来到这里..我已经有了按钮,我需要绑定(bind)这些数字并存储在运算符 ( + - */) 之间的某个位置以显示在我的 JTextAr
这是我的作业。但是,我无法让结果发挥作用。我希望它打印出来为: > 2*7*6 2 * 7 ---- 14 * 6 ---- 84 等等。我希望无论我输入多少个数字,代码都能正常工作
这个问题已经有答案了: What does a "Cannot find symbol" or "Cannot resolve symbol" error mean? (18 个回答) 已关闭 6 年
大家好,感谢您帮助我。 我用 C# 制作了这个计算器,但遇到了一个问题。 当我添加像 5+5+5 这样的东西时,它给了我正确的结果,但是当我想减去两个以上的数字并且还想除或乘以两个以上的数字时,我没有
我一直在开发计算器作为自己的学习项目。它工作正常,只是我无法弄清楚如何阻止人们添加应用程序破坏输入,例如 1++-*/4。我尝试了各种方法,例如将当前显示拆分为一个数组,并将其与具有所有运算符的另一个
我是一名优秀的程序员,十分优秀!