gpt4 book ai didi

python - Pandas MultiIndex DataFrame.rolling offset

转载 作者:太空狗 更新时间:2023-10-30 01:19:11 27 4
gpt4 key购买 nike

为什么在rolling 多索引 DataFrame 时我不能使用偏移量?例如:

rng = pd.date_range('2017-01-03', periods=20, freq='8D')
i = pd.MultiIndex.from_product([['A','B','C'], rng], names=['Name','Date'])
df = pd.DataFrame(np.random.randn(60), i, columns=['Vals'])

如果我尝试使用偏移量进行分组和滚动,我会得到“ValueError: window must be an integer”:

df['Avg'] = df.groupby(['Name'])['Vals'].rolling('30D').mean() # << Why doesn't this work?

并不是说以下这些变体满足我的需求,但请注意,使用 int 进行分组和滚动是可行的:

df['Avg'] = df.groupby(['Name'])['Vals'].rolling(4).mean()

我可以在 DataFrame 的单索引子集上使用偏移量滚动:

d = df.loc['A']
d['Avg'] = d['Vals'].rolling('30D').mean()

如果确实不可能在多索引 DataFrame 上使用偏移量进行滚动,那么对每个 0 级索引项应用一个偏移量的最有效解决方法是什么?

最佳答案

为了使用像“30D”这样的偏移量,您需要一个简单的日期索引。在这种情况下,实现这一点的最简单方法是使用 reset_index(level='Name') 将“Name”移出索引,只留下“Date”作为索引:

df['Avg'] = df.reset_index(level='Name').groupby(['Name'])['Vals'].rolling('30D').mean()

关于python - Pandas MultiIndex DataFrame.rolling offset,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48956286/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com