gpt4 book ai didi

python - 如何在没有数据的情况下删除重复项?

转载 作者:行者123 更新时间:2023-12-01 08:59:53 26 4
gpt4 key购买 nike

我有一个如下所示的 df:

Id   column2   column3  column4   column5
1 1 1 1 nan
1 1 nan nan 1

我想通过 Id 列删除重复项,并将数据保留在 Id 有数据的列中,我该如何执行此操作?

新的 df:

 Id   column2   column3  column4   column5
1 1 1 1 1

目前我正在使用这些代码行,但没有成功地将行与数据保持在一起:

1.  df = df.drop_duplicates(subset='Id',keep='last')

2. df = df.loc[df.notnull().sum(1).groupby(analysis.Id).idxmax()]

最佳答案

使用GroupBy.last返回每个组的最后一个非 NaN 值:

df1 = df.groupby('Id', as_index=False).last()
print (df1)
Id column2 column3 column4 column5
0 1 1 1.0 1.0 1.0 df1 = df.groupby('id', as_index=False).last()

关于python - 如何在没有数据的情况下删除重复项?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52539318/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com