gpt4 book ai didi

python - 在 python 中按数据框分组并在多列上连接字符串

转载 作者:行者123 更新时间:2023-12-05 03:18:12 25 4
gpt4 key购买 nike

我有如下数据框

enter image description here

A,B,C,D
91102,1,john,
91102,2,john,
91102,3,john,
91102,1,,mary
91102,2,,mary
91102,3,,mary
91103,1,sarah,
91103,2,sarah,
91103,3,sarah,
91103,1,,khan
91103,2,,khan
91103,3,,khan

我想要按 A 列和 B 列分组,并希望获得如下所示的所需输出 enter image description here

A,B,C,D
91102,1,john,mary
91102,2,john,mary
91102,3,john,mary
91103,1,sarah,khan
91103,2,sarah,khan
91103,3,sarah,khan

我在下面尝试但没有给出所需的输出

df=df.groupby(['A', 'B'], as_index=False).agg('' .join)

最佳答案

groupby 中,您可以回填,然后取组的第一行。

df.groupby(['A','B'], as_index=False).apply(lambda x: x.bfill().iloc[0])

结果

       A  B      C     D
0 91102 1 john mary
1 91102 2 john mary
2 91102 3 john mary
3 91103 1 sarah khan
4 91103 2 sarah khan
5 91103 3 sarah khan

关于python - 在 python 中按数据框分组并在多列上连接字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73807925/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com