gpt4 book ai didi

cluster-analysis - 哪种算法和超参数的哪种组合最适合对这些数据进行聚类?

转载 作者:行者123 更新时间:2023-12-04 15:06:07 26 4
gpt4 key购买 nike

我在学习非线性聚类算法时遇到了这个二维图。我想知道哪种聚类算法和超参数的组合可以很好地聚类这些数据。

Plot

就像人类将这 5 个尖峰聚集在一起一样。我希望我的算法能够做到这一点。
我尝试了 KMeans,但它只是水平或垂直聚类。我开始使用 GMM,但无法获得适合所需聚类的超参数。

最佳答案

如果它不起作用,请始终尝试首先改进预处理。 k-means 等算法对缩放非常敏感,因此需要谨慎选择。

GMM 显然是您的首选。可能值得尝试不同的工具。 R 的 Mclust 非常慢。 Sklearn 的 GMM 有时不稳定。 ELKI 入门有点难,但它的 EM 通常给我最好的结果。

除了 GMM,它可能值得一试 相关聚类 .这些算法假设有一些流形(例如,一条线)存在一个集群。示例包括 ORCLUS、LMCLUS、CASH、4C ……但在我看来,这些主要适用于合成玩具数据。

关于cluster-analysis - 哪种算法和超参数的哪种组合最适合对这些数据进行聚类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56395293/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com