gpt4 book ai didi

machine-learning - APPLY_KMEANS 在 Vertica 中如何工作

转载 作者:行者123 更新时间:2023-11-30 09:52:46 30 4
gpt4 key购买 nike

我正在 Vertica 中测试机器学习工具。我了解 KMEANS 的工作原理,因为它只是将数据划分为集群。但是我不明白 APPLY_KMEANS 如何处理新数据。在我看来,它更像是一种分类方法。因为它对现有集群中的新数据进行分类。那么用什么算法(K近邻)呢?从文档中来看还不是很清楚。

最佳答案

k-means 是一种聚类算法(不是分类!),迭代 2 个步骤:

  • 分配步骤:为每个点分配一个质心
  • 更新步骤:更新质心坐标

当您构建 k-means 模型时,首先初始化质心(不同的策略,可以是随机初始化),然后进行迭代,直到聚类正常(您的误差低于给定阈值)。

定义模型的实际上是你的质心。

使用APPLY_KMEANS时,您将使用查询中的数据和模型中的质心运行分配步骤。然后,根据点相对于质心的距离,将点分配给簇。

希望有帮助pltrdy

<小时/>

有关聚类与分类的注意事项:
我们可能会认为聚类是一种分类。尽管如此,分类必须仅引用 supervised learning而聚类对应于unsupervised learning 。因此,不要这样做:)

关于machine-learning - APPLY_KMEANS 在 Vertica 中如何工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41830066/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com