gpt4 book ai didi

machine-learning - 机器学习中如何处理具有其他属性的时间序列数据?

转载 作者:行者123 更新时间:2023-11-30 08:52:43 25 4
gpt4 key购买 nike

我正在研究一个二元分类问题,如果每个数据实例都有多个不同指标的时间序列,并且还有一些其他属性。如何处理时间序列,将它们视为单独的属性?但这会丢失与时间维度相关的信息。

为了更具体,训练实例的示例如下所示:

ID MetricA_Day1 MetricA_Day2 ..... MetricA_Day31 MetricB_Day1....MetricB_Day2 AttributeC AttributeD AttributeE

是否有关于如何处理此问题的最佳实践?

最佳答案

首先,“通用”答案:不,机器学习的最佳实践中不存在这样的事情。事实上,只有不好的当前流行的,而没有“最好的”。即使对于二元线性分类,训练几何模型(SVM?)还是概率模型更好也取决于数据。即使我们缩小到某个特定模型(比如神经网络),即使在数据扩展方面也没有最佳实践。应该在[0,1]中吗?或者也许是[-1,1]?均值 0 和方差 1 呢?协方差矩阵又如何呢?

现在了解详细信息 - 您的问题几乎没有提供有关数据的信息。说“我有一些属性和一些时间序列”远不能提供任何真正有洞察力和有值(value)的答案的机会。但这似乎不是一个有明确答案的任务,这是一项长期的研究任务。

在研究过程中您可以搜索什么?

  • 这里真的需要如此丰富的代表性吗?人们倾向于认为“越多越好”,但就机器学习而言,这不一定是正确的。更简单、信息更丰富的表示通常会更好。也许尝试将时间序列表示为一些一般特征,例如频率特征、幅度等。
  • 内核方法可以使用非常广泛的相似性度量,特别是您可以为表示的每个“部分”定义不同的度量 - 因此时间序列将使用专用内核,而简单属性则使用一些简单的内核,并且一般来说您只需使用这些内核的总和(这也是一个有效的内核)
  • 可以使用基于距离的方法(例如 kNN)通过为每个维度定义不同的距离来执行类似的方法
  • 您还可以为表示的每个“部分”训练单独的分类器 - 同样 - 时间序列有一些专门的时间序列分类器等,并将它们用作集合(有很多方法使用这样的集合,这是目前机器学习中相当热门的话题)

关于machine-learning - 机器学习中如何处理具有其他属性的时间序列数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18853557/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com