gpt4 book ai didi

machine-learning - 一种视觉上可分离簇的聚类算法

转载 作者:行者123 更新时间:2023-11-30 08:54:35 25 4
gpt4 key购买 nike

在使用 PCA 后,我以 2D 形式可视化了一个数据集。 1 维是时间,Y 维是第一个 PCA 分量。如图所示,点(A、B)之间有较好的分离。但不幸的是,聚类方法(DBSCAN、SMO、KMEANS、Hierarchical)无法将这些点聚类为 2 个簇。正如你在A部分看到的,有一个相对的连续性,这个连续的过程结束了,B部分开始了,A和B之间与过去的数据相比有相当大的差距。

如果您能向我介绍任何方法和算法(或根据数据的分布设计任何指标),以便能够在不可视化的情况下分离 A 和 B,我将非常感激。非常感谢。

Mentioned Figure - Plot of points

这是上图(第一个)的 2 个 PCA 分量的图。另一个也是其他数据集的组成部分的图,我也得到了不好的结果。 Plot of PCA compnents-bad results

Plot of PCA components for another dataset-bad results

最佳答案

这是一个时间序列,显然您正在寻找变化点或想要分割此时间序列。

不要将此数据集视为二维 x-y 数据集,并且不要在此处使用聚类;而是选择实际为时间序列设计的算法。

首先,绘制series[x] - series[x-1],即一阶导数。您可能需要消除季节性才能改善结果。没有任何聚类算法可以做到这一点,它们没有季节性或时间的概念。

关于machine-learning - 一种视觉上可分离簇的聚类算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38668548/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com