gpt4 book ai didi

python - Pandas 在 groupby 上组合列

转载 作者:太空宇宙 更新时间:2023-11-03 14:03:30 25 4
gpt4 key购买 nike

我打算在groupby之后组合Pandas DataFrame的列。我寻找可以使用的选项,但没有一个能满足我的需求。最接近的选项是 .agg() ,它对列的值执行操作,但是,我想计算每个给定的 groupbyed 行的所有 features 的统计信息。

我正在寻找这样的东西:

dataset.groupby(['company', 'team']).combine(new_cols=['features_mean'], to_combine=['feature 1':'feature 2'], funcs=[np.mean], axis=1)

enter image description here

最佳答案

使用loc意思:

dataset['new measure'] = dataset.loc[:, 'Feature 1':'Feature 12'].mean(axis=1)

示例:

dataset = pd.DataFrame({'A':list('abcdef'),
'Feature 1':[4,5,4,5,5,4],
'Feature 2':[7,8,9,4,2,3],
'Feature 3':[1,3,5,7,1,0],
'Feature 4':[5,3,6,9,2,4],
'F':list('aaabbb')})

#print (dataset)

dataset['new measure'] = dataset.loc[:, 'Feature 1':'Feature 4'].mean(axis=1)
print (dataset)
A F Feature 1 Feature 2 Feature 3 Feature 4 new measure
0 a a 4 7 1 5 4.25
1 b a 5 8 3 3 4.75
2 c a 4 9 5 6 6.00
3 d b 5 4 7 9 6.25
4 e b 5 2 1 2 2.50
5 f b 4 3 0 4 2.75

关于python - Pandas 在 groupby 上组合列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49084795/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com