gpt4 book ai didi

machine-learning - 在Python中对时间序列数据进行聚类

转载 作者:行者123 更新时间:2023-11-30 08:37:52 25 4
gpt4 key购买 nike

我正在尝试使用不同的聚类技术在 Python 中对时间序列数据进行聚类。 K-means 没有给出好的结果。下图是我使用凝聚聚类进行聚类后的结果。我还尝试了动态时间扭曲。这两个似乎给出了相似的结果。

我理想地希望第二张图像中的时间序列有两个不同的集群。第一个图像是快速增加的簇。第二个代表没有增加,类似于稳定,第三个是代表下降趋势的集群。我想知道哪些时间序列既稳定又受欢迎(这里的流行是指高计数)。我尝试了层次聚类,但结果显示层次结构太多,我不知道如何选择层次结构的级别。有人可以阐明如何将第二张图像中的时间序列分成两个不同的集群,一个具有低计数,另一个具有高计数?有可能做到吗?或者我应该只是视觉上选择一个阈值将它们切成两半?

快速增长的集群:

enter image description here

具有稳定计数的集群:

enter image description here

具有下降趋势的集群:

enter image description here

这是非常非常模糊的,但这是我的层次聚类的结果。

enter image description here我知道这个特定的图像根本没有用,但这对我来说也像是一个死胡同。

一般来说,如果您想区分趋势(例如 YouTube 视频),如何仅将某些内容纳入“热门”部分,而另一些内容纳入“本周热门”部分?据我了解,“热门”部分视频是与第一张图像显示相似特征的视频。 “本周热门”部分包含观看次数非常高但数量非常稳定的视频集合(即没有显示快速增长)。我知道就 YouTube 而言,除了观看次数之外,还需要考虑许多其他因素。对于第二张图片,我想做的与“本周趋势”部分类似。我想选择那些计数非常高的。在这种情况下如何分割时间序列?

我知道 DTW 捕捉趋势。 DTW 给出了与上图相同的结果。它确定了第二张图像中“稳定”的趋势。但它在这里没有捕获“计数”元素。我希望捕获趋势和计数,在本例中是稳定且高计数。

以上图像是基于计数聚类的时间序列。我是否错过了任何其他可以实现这一目标的聚类技术?即使只有计数,我如何根据我的需要进行不同的聚类?

任何想法将不胜感激。提前致谢!

最佳答案

您能做的最好的事情就是从时间序列中提取一些特征。在您的案例中要提取的第一个特征是趋势 linear trend estimation

您可以做的另一件事是对时间序列的累积版本进行聚类,如另一篇文章中建议和解释的那样:Time series distance metrics

关于machine-learning - 在Python中对时间序列数据进行聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45604143/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com