gpt4 book ai didi

statistics - 当 KMeans 返回少于 K 个集群时该怎么办?

转载 作者:行者123 更新时间:2023-12-04 00:46:41 27 4
gpt4 key购买 nike

我已经在 J​​ava 中实现了 K-Means 并且有点头疼。我通过在数据点值范围内的每个维度中选择一个随机值来选择我的初始质心。我遇到过这样的情况,这会导致这些质心中的一个或多个最终不会成为任何数据点的壁橱质心。那么下一次迭代我该怎么做呢?就让它保持原来的随机值?选择一个新的随机值?计算为其他质心的平均值?原始算法中似乎没有考虑到这一点,但可能我只是错过了一些东西。

最佳答案

k-means 的大多数实现使用实际数据点定义初始质心,而不是由变量绘制的边界框中的随机点。但是,以下是解决您实际问题的一些建议。

您可以随机获取另一个数据点并使其成为新的集群质心。这实现起来非常简单且快速,并且不会对算法产生不利影响。

您还可以尝试使用 kmeans++ 对集群质心进行更智能的初始选择。 .该算法随机选择第一个质心,并选择剩余的 K-1 个质心来尝试最大化质心间距离。通过选择更智能的质心,您不太可能遇到质心被分配零数据点的问题。

如果您想稍微聪明一点,可以使用 kmeans++ 算法在质心被分配零数据点时创建新质心。

关于statistics - 当 KMeans 返回少于 K 个集群时该怎么办?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8720815/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com