gpt4 book ai didi

python - 计算 Pandas 时间序列中的协方差

转载 作者:太空宇宙 更新时间:2023-11-04 03:59:22 25 4
gpt4 key购买 nike

如果这被记录在某处而我只是找不到它,请提前致歉:

假设我有一个如下所示的时间序列数据框:

WEEK_END_DATE              TITLE_SHORT          SALES  
2012-02-25 00:00:00.000000 "Bob" (EBK) 1
2012-03-31 00:00:00.000000 "Bob" (EBK) 1
2012-03-03 00:00:00.000000 "Sally" (EBK) 1
2012-03-10 00:00:00.000000 "Sally" (EBK) 1
2012-03-17 00:00:00.000000 "Sally" (EBK) 1
2012-04-07 00:00:00.000000 "Sally" (EBK) 1

我想计算销售额的协方差,以便找到倾向于一起移动的用户。我知道 Pandas 有一个协方差特征:http://pandas.pydata.org/pandas-docs/stable/computation.html#covariance ,但我不确定如何为这种目的 reshape 我的数据。

我是否认为需要将用户设置为列索引,以便每个系列都是跨时间系列的向量?我不知道该怎么做。

最佳答案

您正在寻找 Pandas pivot .首先做:

df.pivot(index='WEEK_END_DATE', columns='TITLE_SHORT', values='SALES')

您应该将 Bob 和 Sally 作为列。然后你就可以用这两列做正常的相关分析。

关于python - 计算 Pandas 时间序列中的协方差,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16513727/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com