gpt4 book ai didi

machine-learning - 改进某些数据集上的 K 均值

转载 作者:行者123 更新时间:2023-11-30 09:37:52 27 4
gpt4 key购买 nike

任何人都知道如何调整简单的 K 均值算法来处理 this form 的数据集.

最佳答案

在仍然使用 k-means 的同时处理该形式的数据的最直接方法是使用 k-means 的内核化版本。 JSAT 库中存在它的 2 个实现(请参见此处 https://github.com/EdwardRaff/JSAT/blob/67fe66db3955da9f4192bb8f7823d2aa6662fc6f/JSAT/src/jsat/clustering/kmeans/ElkanKernelKMeans.java )

正如 Nicholas 所说,另一种选择是创建一个运行 k-means 的新特征空间。然而,这需要先了解您将要聚类的数据类型。

之后,您实际上只需要转向不同的算法即可。 k-means 是一种简单的算法,它对世界做出简单的假设,当这些假设被严重违反时(非线性可分离簇是这些假设之一),那么你只需要接受它并选择一个更合适的算法。

关于machine-learning - 改进某些数据集上的 K 均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29463266/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com