gpt4 book ai didi

algorithm - K-Means++ 的流程是什么,我想知道 K-Mean 和 K-Means++ 之间的确切区别?

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:51:03 27 4
gpt4 key购买 nike

我想知道 K-Mean 和 K-Means++ 算法之间的区别。如果有人了解 K-Means++ 算法的流程,您能举例说明一下吗?虽然,我了解 K-Mean 算法,但发现如何实现 K-Means++ 算法对我来说很困难,因为我不明白这个算法的工作流程:很清楚。谢谢大家。

最佳答案

说您想知道 k-meansk-means++ 之间的区别是不准确的。因为,这两种算法不是可比性的,而是相互集成的。

Kmeans++来自维基百科的定义:

k-means++ is an algorithm for choosing the initial values (or "seeds") for the k-means clustering algorithm

并且需要这样一种算法的存在,因为 k-means 在性能和准确性方面存在问题(取决于您分析数据的方式和整个预处理步骤)。

关于你的问题:

finding how to implement K-Means++ algorithm is difficult for me because I don't understand the work flow of this algo: clearly.

您从数据集中的一个随机点开始,然后计算该集中每个点与所选点之间的距离(欧氏距离可以是您的选择之一)。然后,使用 weighted probability distribution 随机选择一个新数据点作为新中心。其中点 x 是用 probability proportional 选择的到 D(x)2。然后重做同样的事情(除了从随机点开始)直到你到达你需要的 k 集群(k 应该作为参数传递给算法)。

在您拥有 k 个集群之后,您可以继续使用 k-means请注意,这主要来自维基百科,但我的意思是,您将 k-means++ 作为 k-means 的替代品,这不是,这是上述定义所述。

最后,k-means++ 足以帮助克服 k-means 存在的一些问题,但是通过将聚类数 (k) 作为输入参数传递给它,它不再可扩展的。但是,还有另一个版本的 k-means 称为 k-means2 (我没有搜索其他来源)如果您有兴趣,可能会克服可扩展性问题。

关于algorithm - K-Means++ 的流程是什么,我想知道 K-Mean 和 K-Means++ 之间的确切区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22521909/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com