gpt4 book ai didi

python-3.x - Pandas数据框按ID合并文本行组

转载 作者:行者123 更新时间:2023-12-03 23:53:07 27 4
gpt4 key购买 nike

我有一个数据框如下:

ID    Date          Text  
1 01/01/2019 abcd
1 01/01/2019 pqrs
2 01/02/2019 abcd
2 01/02/2019 xyze

我要合并 Text通过 ID在 Python 中使用 group by 子句。

我想合并' Text ' 列分组 ID .
ID    Date        Text
1 01/01/2019 abcdpqrs
2 01/02/2019 abcdxyze

我想在 Python 中做到这一点。

我尝试了以下代码块,但没有奏效:
  • groups = groupby(dataset_new, key=ID(1))
  • dataset_new.group_by{row['Reference']}.values.each do |group|
    puts [group.first['Reference'], group.map{|r| r['Text']} * ' '] * ' | '
    end

  • 我还尝试使用公式在 excel 中合并文本,但它也没有给出所需的结果。

    最佳答案

    试试 groupbysum .从您的错误信息和 df.info() 的输出来看似乎有混合 dtype 和 NaNText 列中.我建议转换 NaN使用 fillna('') 清空字符串,然后使用 astype(str) 将列中的所有元素转换为字符串.

    df = pd.DataFrame({'ID': [1,1,2,2], 
    'Date': ['01/01/2019', '01/01/2019', '01/02/2019', '01/02/2019'],
    'Text': ['abcd', 'pqrs', 'abcd', 'xyze']})

    df['Text'] = df['Text'].fillna('').astype(str)
    df_grouped = df.groupby(['ID', 'Date'])['Text'].sum()
    print(df_grouped)

    这应该返回
    ID  Date      
    1 01/01/2019 abcdpqrs
    2 01/02/2019 abcdxyze

    关于python-3.x - Pandas数据框按ID合并文本行组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54436161/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com