gpt4 book ai didi

machine-learning - 时间序列之间的相关性

转载 作者:行者123 更新时间:2023-11-30 08:56:51 25 4
gpt4 key购买 nike

我有一个数据集,其中的过程被描述为由约 2000 个点和 1500 个维度组成的时间序列。

我想量化每个维度与通过另一种方法测量的另一个时间序列的相关程度。

执行此操作的适当方法是什么(最终在 python 中完成)?我听说 Pearson 不太适合这项任务,至少在没有数据准备的情况下。您对此有何看法?

非常感谢!

最佳答案

数据科学中的一个普遍良好规则是首先尝试简单的事情。只有当简单的事情失败时,你才应该转向更复杂的事情。考虑到这一点,以下是计算每个维度与其他时间序列之间的 PIL 逊相关性的方法。这里的关键功能是 pearsonr :

import numpy as np
from scipy.stats import pearsonr

# Generate a random dataset using 2000 points and 1500 dimensions
n_times = 2000
n_dimensions = 1500
data = np.random.rand(n_times, n_dimensions)

# Generate another time series, also using 2000 points
other_time_series = np.random.rand(n_times)

# Compute correlation between each dimension and the other time series
correlations = np.zeros(n_dimensions)
for dimension in range(n_dimensions):
# The Pearson correlation function gives us both the correlation
# coefficient (r) and a p-value (p). Here, we only use the coefficient.
r, p = pearsonr(data[:, dimension], other_time_series)
correlations[dimension] = r

# Now we have, for each dimension, the Pearson correlation with the other time
# series!
len(correlations)

# Print the first 5 correlation coefficients
print(correlations[:5])

如果 Pearson 相关性不适合您,您可以尝试将 pearsonr 函数替换为其他函数,例如:

  • spearmanr Spearman 排序相关系数。
  • kendalltau Kendall tau,序数数据的相关性度量。

关于machine-learning - 时间序列之间的相关性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56682533/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com