gpt4 book ai didi

Python - 如何规范化时间序列数据

转载 作者:太空狗 更新时间:2023-10-29 22:04:11 25 4
gpt4 key购买 nike

我有一个时间序列示例数据集。我想计算各种时间序列示例之间的相似性,但是我不想考虑缩放引起的差异(即我想查看时间序列形状的相似性,而不是它们的绝对值)。因此,为此,我需要一种规范化数据的方法。也就是说,使所有时间序列示例都落在某个区域之间,例如 [0,100]。谁能告诉我如何在 python 中完成此操作

最佳答案

给出的解决方案适用于既非递增也非递减(平稳)的序列。在金融时间序列(或任何其他有偏差的序列)中,给出的公式是不正确的。它应该首先去除趋势或根据最新的 100-200 个样本执行缩放。
如果时间序列不是来自正态分布(如金融领域的情况),则建议应用非线性函数(例如标准 CDF 函数)来压缩异常值。
Aronson 和 Masters 的书(用于算法交易的统计机器学习)使用以下公式(基于 200 天的 block ):

V = 100 * N ( 0.5( X -F50)/(F75-F25)) -50

地点:
X : 数据点
F50 : 最近200点的平均值
F75 : 百分位数 75
F25 : 百分位数 25
N : 正常 CDF

关于Python - 如何规范化时间序列数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19256930/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com