gpt4 book ai didi

algorithm - k-means 初始中心决定结果?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:55:48 32 4
gpt4 key购买 nike

K-means 聚类是一种常用的聚类方法。假设有N个点进行K均值聚类,即要将N个点分成K组,每组中的点具有相似性。

并且我们应该在K-means聚类过程之前给初始中心赋值,这里我从所有点中随机选择K个点,程序每次运行得到不同的输出。为什么这会导致不同的结果,我如何知道哪个是最佳分类?

最佳答案

首先,k-means 聚类算法不一定产生最佳结果,因此这已经是一个相当重要的指标,表明它可能从不同的起点得到不同的结果。

归根结底,每个集群都使用自己集群中的点来确定它应该移动到哪里——如果所有集群都找到了各自点的中心,算法就会终止,然后这可以通过多种方式发生。

考虑这个例子:(4 个点由 . 表示,2 个簇由 x 表示)

.         .                      .    x    .
x x versus
. . . x .

左右两边都收敛了,但明显不同(右边明显更差)。

要找到最好的一个,您可以选择使从中心到分类在其下的每个点的平方距离总和最小的结果(毕竟,这是 the goal of k-means clustering )。

关于algorithm - k-means 初始中心决定结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20976722/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com