gpt4 book ai didi

algorithm - 改进 k 均值聚类

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:24:31 25 4
gpt4 key购买 nike

我的计算机视觉讲义提到,如果我们知道聚类的标准差,则可以提高 k-means 聚类算法的性能。为何如此?

我的想法是,我们可以使用标准差首先通过基于直方图的分割得出更好的初始估计。你怎么认为?感谢您的帮助!

最佳答案

您的讲师可能有 2002 paper by Veenman et al心里。基本思想是您设置每个集群中允许的最大方差。您从与数据点一样多的集群开始,然后通过

“进化”集群
  • 如果生成的簇的方差低于阈值,则合并相邻簇
  • 如果簇的方差高于阈值,则隔离“远”的元素
  • 或者在相邻簇之间移动一些元素,如果它减少平方误差的总和

(这种演变充当全局优化过程,并防止初始分配集群意味着你在 k-means 中的不良后果)

总而言之,如果您知道方差,您就知道聚类应该有多少变化,因此更容易例如检测异常值(通常应将其放入单独的集群中)。

关于algorithm - 改进 k 均值聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4648064/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com