gpt4 book ai didi

python - 在相同值的情况下合并 pandas dataframe 单元格

转载 作者:太空宇宙 更新时间:2023-11-04 00:47:36 26 4
gpt4 key购买 nike

我正在尝试制作一个新的数据框,如果“类型”出现不止一次,这些行的“国家”单元格和“年份”单元格的内容将组合在一行中(“如何” ' 列的行为类似于 '类型' 列:如果类型相似,则方法也相似)。

我的 pd 数据框如下所示,df:

   type   country   year   how
0 't1' 'UK' '2009' 'S'
1 't2' 'GER' '2010' 'D'
2 't2' 'USA' '2011' 'D'
3 't3' 'AUS' '2012' 'F'
4 't4' 'CAN' '2013' 'R'
5 't5' 'SA' '2014' 'L'
6 't5' 'RU' '2015' 'L'

df2 应该是这样的:

   type   country        year         how
0 't1' 'UK' '2009' 'S'
1 't2' 'GER, USA' '2010, 2011' 'D'
2 't3' 'AUS' '2012' 'F'
3 't4' 'CAN' '2013' 'R'
4 't5' 'SA, RU' '2014, 2015' 'L'

我很确定根据“类型”(或类型和方式)进行分组是必要的。例如,使用 first() 删除第二个相似类型的行。有没有一些方便的方法来代替组合单元格(字符串)?提前致谢。

最佳答案

使用groupby/agg使用 ', '.join 作为聚合器:

import pandas as pd
df = pd.DataFrame({'country': ['UK', 'GER', 'USA', 'AUS', 'CAN', 'SA', 'RU'],
'how': ['S', 'D', 'D', 'F', 'R', 'L', 'L'],
'type': ['t1', 't2', 't2', 't3', 't4', 't5', 't5'],
'year': ['2009', '2010', '2011', '2012', '2013', '2014', '2015']})

result = df.groupby(['type','how']).agg(', '.join).reset_index()

产量

  type how   country        year
0 t1 S UK 2009
1 t2 D GER, USA 2010, 2011
2 t3 F AUS 2012
3 t4 R CAN 2013
4 t5 L SA, RU 2014, 2015

关于python - 在相同值的情况下合并 pandas dataframe 单元格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38728705/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com