gpt4 book ai didi

python - 是否有一个 pandas 函数可以对数据框中的一组前行元素求和?

转载 作者:行者123 更新时间:2023-12-01 07:09:49 25 4
gpt4 key购买 nike

我正在尝试创建一个函数,它可以查看 DataFrame 中的前几行,并根据要回顾的一组行数对它们进行求和。这里我使用了 3 个,但理想情况下我想将其放大以查看更多行。我的解决方案有效,但似乎效率不高。另一个标准是每次击中新团队时,计数必须重新开始,因此每个新团队的第一行始终为 0,数据将按团队顺序排序,但如果解决方案已知数据不存在的位置在团队秩序中,这将是令人难以置信的。Pandas 中有一个函数可以帮助解决这个问题吗?

到目前为止,我已经尝试了下面的代码并尝试用谷歌搜索问题,我能找到的最接近的例子是:here !但这对索引进行了分组,当每次遇到新团队时该值必须不断重置时,我不确定如何应用它,因为每次有新团队时它都不会区分。

np.random.seed(0)
data = {'team':['a','a','a','a','a','a','a','a','b','b',
'b','b','b','b','b','b','c','c','c','c','c','c','c','c'],
'teamPoints': np.random.randint(0,4,24)}

df = pd.DataFrame.from_dict(data)
df.reset_index(inplace=True)


def find_sum_last_3(x):
if x == 0:
return 0
elif x == 1:
return df['teamPoints'][x-1]
elif x == 2:
return df['teamPoints'][x-1] + df['teamPoints'][x-2]



elif df['team'][x] != df['team'][x-1]:
return 0
elif df['team'][x] != df['team'][x-2]:
return df['teamPoints'][x-1]
elif df['team'][x] != df['team'][x-3]:
return df['teamPoints'][x-1] + df['teamPoints'][x-2]


else:
return df['teamPoints'][x-1] + df['teamPoints'][x-2] +
df['teamPoints'][x-3]

df['team_form_3games'] = df['index'].apply(lambda x : find_sum_last_3(x))

该函数的第一部分解决了由于元素少于 3 个而无法求和为 3 的边缘情况

该功能的第二部分解决了“团队”变更的问题。当团队发生变化时,总和需要重新开始,因此每个“团队”都是单独考虑的

最后一部分只是查看 dataFrame 的前 3 个元素并将它们相加。

此示例按预期工作,并提供一个具有预期输出的新列,如下所示:

0, 0, 3, 4, 4, 4, 6, 9, 0, 1, 4, 5, 6, 3, 5, 5, 0, 0, 0, 2, 3, 5, 6, 8

第一个元素是 0,因为它是边缘情况,第二个元素是 0,因为第一个元素的总和是 0。第三个元素是 3,因为第一个和第二个元素的总和是 3。第四个是第一个、第二个元素的总和,第三。第五是第二、第三、第四的总和。 6 是 3、4、5 的总和

然而,当扩展到 10 时,它的效率非常低,这使得很难扩展到 10 或 15。它也很不优雅,并且需要为每个不同长度的总和编写一个新函数。

最佳答案

我认为您正在寻找 GroupBy.apply + 滚动:

r3=df.groupby('team')['teamPoints'].apply(lambda x: x.rolling(3).sum().shift())
r2=df.groupby('team')['teamPoints'].apply(lambda x: x.rolling(2).sum().shift())
r1=df.groupby('team')['teamPoints'].apply(lambda x: x.shift())
df['team_form_3games'] = r3.fillna(r2.fillna(r1).fillna(0))
print(df)

输出:

    index team  teamPoints  team_form_3games
0 0 a 0 0.0
1 1 a 3 0.0
2 2 a 1 3.0
3 3 a 0 4.0
4 4 a 3 4.0
5 5 a 3 4.0
6 6 a 3 6.0
7 7 a 3 9.0
8 8 b 1 0.0
9 9 b 3 1.0
10 10 b 1 4.0
11 11 b 2 5.0
12 12 b 0 6.0
13 13 b 3 3.0
14 14 b 2 5.0
15 15 b 0 5.0
16 16 c 0 0.0
17 17 c 0 0.0
18 18 c 2 0.0
19 19 c 1 2.0
20 20 c 2 3.0
21 21 c 3 5.0
22 22 c 3 6.0
23 23 c 2 8.0

关于python - 是否有一个 pandas 函数可以对数据框中的一组前行元素求和?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58278266/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com