gpt4 book ai didi

python - 合并列,使具有重复元素的行用逗号分隔

转载 作者:行者123 更新时间:2023-12-04 08:14:34 24 4
gpt4 key购买 nike

这是我拥有的输入数据框。
Input DataFrame
这是我想要的输出:
Output DataFrame
如您所见,两个数据框都在 Key1 列上合并,使得具有公共(public)元素的行用逗号分隔。
我试过使用合并,但它没有给出正确的输出。

mer = pd.merge(df,df, on='Key1', how='inner')
有没有具体的方法来解决这个问题?

最佳答案

您可以将值转换为字符串并通过 , 连接唯一值在自定义 lambda 函数中:
处理 Key1 中缺失值的解决方案在较旧的 pandas 版本中,用临时值替换:

df1 = (df.fillna({'Key1': 'missing'}) 
.groupby('Key1')
.agg(lambda x: ','.join(pd.unique(x.astype(str))))
.reset_index()
.replace({'Key1':{'missing':np.nan}}))
最新 Pandas 版本的解决方案:
df1 = (df.groupby('Key1')
.agg(lambda x: ','.join(pd.unique(x.astype(str))))
.reset_index())

关于python - 合并列,使具有重复元素的行用逗号分隔,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65771876/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com