gpt4 book ai didi

algorithm - k均值聚类可以做分类吗?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:22:04 26 4
gpt4 key购买 nike

我想知道k-means聚类算法能不能做分类?

如果我做了一个简单的 k-means 聚类。

假设我有很多数据,我使用k-means聚类,然后得到2个聚类A,B。质心计算方法是欧氏距离。

左侧的集群 A。

右侧的集群 B。

所以,如果我有一个新数据。我该怎么办?

  1. 再次运行k-means聚类算法,可以得到新数据属于哪个簇?

  2. 记录最后一个质心并使用欧几里德距离计算确定新数据属于?

  3. 其他方法?

最佳答案

最简单的方法当然是 2.,将每个对象分配给最近的质心(从技术上讲,使用平方和,而不是欧几里得距离;这对于 k-means 更正确,并且可以节省 sqrt 计算)。

方法 1. 很脆弱,因为 k-means 可能会给你一个完全不同的解决方案;特别是如果它一开始就不能很好地适合您的数据(例如维度太高、大小差异太大的簇、太多的簇……)

不过,下面的方法可能更合理:

<强>3。训练一个实际的分类器。

是的,您可以使用 k-means 生成初始分区,然后假设 k-means 分区可能是合理的类(您真的应该在某个时候验证这一点),然后如果数据已被用户标记,则继续操作。

即运行 k-means,在生成的集群上训练 SVM。然后使用SVM进行分类。

k-NN 分类,甚至将每个对象分配到最近的聚类中心(选项 1)可以看作是非常简单的分类器。后者是 1NN 分类器,仅在簇质心上“训练”。

关于algorithm - k均值聚类可以做分类吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22300830/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com