gpt4 book ai didi

algorithm - 支持向量机 - 一个简单的解释?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:22:17 25 4
gpt4 key购买 nike

所以,我试图了解 SVM 算法是如何工作的,但我只是无法弄清楚如何将某些数据集转换为具有数学意义的 n 维平面点,以便通过超平面分离这些点,对它们进行分类。

有一个例子 here ,他们试图对老虎和大象的图片进行分类,他们说“我们将它们数字化为 100x100 像素的图像,所以我们在 n 维平面中有 x,其中 n=10,000”,但我的问题是他们如何转换矩阵实际上只代表一些具有数学意义的颜色代码 IN 点,以便将它们分为两类?

可能有人可以在 2D 示例中向我解释这一点,因为我看到的任何图形表示都只是 2D,而不是 nD。 svm

最佳答案

简短的回答是:它们不变换矩阵,而是将矩阵中的每个元素视为一个维度(在机器学习中,每个元素都称为一个特征)。因此,他们需要对每个具有 100x100 = 10000 个特征的元素进行分类。在线性 SVM 案例中,他们使用 hyperplane ,它将 10,000 维空间划分为两个不同的区域。

更长的答案是:考虑你的二维案例。现在,您想要分离一组二维元素。这意味着集合中的每个元素都可以在数学上描述为一个二元组,即:e = (x1, x2)。例如,在您的图中,一些实心点可能是:{(1,3), (2,4)},而一些空心点可能是{(4,2), (5,1)}。请注意,为了将它们分类为 linear classifier ,你需要一个二维线性分类器,它会产生一个可能看起来像这样的决策规则:

  • e = (x1, x2)
  • if (w1 * x1 + w2 * x2) > C : 判定 e 是一个完整的点。
  • 否则:e 是空心的。

请注意,分类器是线性,因为它是 e 的元素的线性组合。 “w”称为“权重”,“C”是决策阈值。如上所述具有 2 个元素的线性函数只是一条线,这就是为什么在您的图中 H 是线。

现在,回到我们的 n 维情况,您可能会认为一条线无法解决问题。在 3D 情况下,我们需要一个平面:(w1 * x1 + w2 * x2 + w2 * x3) > C,在 n 维情况下,我们需要一个超平面:(w1 * x1 + w2 * x2 + ... + wn * xn) > C,很难想象,但还是要画 :-)。

关于algorithm - 支持向量机 - 一个简单的解释?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6160495/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com