gpt4 book ai didi

python - 为什么 pandas groupby 在数据框中添加额外的 (groupby_info) 列以及如何删除它们?

转载 作者:太空宇宙 更新时间:2023-11-03 14:29:43 24 4
gpt4 key购买 nike

我有 4 列的数据框 df_M,并按 '蛋白质' 分组并按 '[M]' 排序。

df_M = df_M[['protein', 'cl', 'pept', '[M]']]
df_M = df_M.groupby('protein').apply(pd.DataFrame.sort_values, '[M]')

结果前面有两列,分别是'蛋白质'index的复制?如何在不获取这些列的情况下进行分组和排序?

最佳答案

我认为您不需要groupby,而是需要按sort_values按两列sort :

df_M = df_M.sort_values(['protein','[M]'])

但如果想使用groupby添加参数group_keys=False:

group_keys : boolean, default True

When calling apply, add group keys to index to identify pieces

df_M = df_M.groupby('protein', group_keys=False).apply(pd.DataFrame.sort_values, '[M]')

示例:

df_M = pd.DataFrame({'protein':list('ababba'),
'[M]':[2,3,5,8,0,6],
'cl':[1,2,3,4,5,6]})

print (df_M)
[M] cl protein
0 2 1 a
1 3 2 b
2 5 3 a
3 8 4 b
4 0 5 b
5 6 6 a

df_M = df_M.sort_values(['protein','[M]'])

#df_M = df_M.groupby('protein', group_keys=False).apply(pd.DataFrame.sort_values, '[M]')

print (df_M)
[M] cl protein
0 2 1 a
2 5 3 a
5 6 6 a
4 0 5 b
1 3 2 b
3 8 4 b

关于python - 为什么 pandas groupby 在数据框中添加额外的 (groupby_info) 列以及如何删除它们?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47388083/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com