gpt4 book ai didi

algorithm - 具有多个特征时间序列信息的对象的聚类算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:33:44 24 4
gpt4 key购买 nike

我正在寻找可以处理每个对象的多个时间序列信息的聚类算法。

例如,对于公司“A”,我们有 3 个特征(例如收入、销售额、库存)的时间序列
同样,“B”公司也具有相同时间序列的相同特征。等等..

那么,我们如何在公司集合之间建立集群呢?有什么明智的方法来处理这个问题吗?

最佳答案

许多聚类算法要求您提供一些衡量两点之间相似性或距离的方法。真正由您来决定哪些功能是重要的,以及真正的距离是多少。一种前进的方式是使用两个时间序列之间的相关性。这给了你一个相似之处。如果你必须将它转换为距离,我会使用 sqrt(1-r),其中 r 是相关性,因为如果你看,例如在 http://www.analytictech.com/mb876/handouts/distance_and_correlation.htm 底部的等式中如果你在 n 维空间中有点,你可以看到这与距离成正比。如果您有三个不同的时间序列(收入、销售额、库存),我会使用从相同类型的两个时间序列之间的相关性得出的三个距离之和。

另一种选择,特别是如果时间序列不是很长,将长度为 n 的时间序列视为 n 维空间中的一个点并将其输入聚类算法,或使用 http://en.wikipedia.org/wiki/Principal_component_analysis通过查看最重要的组件将 n 维减少到 1(当你这样做时,使用最不重要的组件绘制点并调查从其他组件中脱颖而出的点永远不会有坏处。数据所在的点错误有时会在这里突出)。

关于algorithm - 具有多个特征时间序列信息的对象的聚类算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22264147/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com