gpt4 book ai didi

python - python 数据框删除重复项

转载 作者:行者123 更新时间:2023-12-01 08:36:00 26 4
gpt4 key购买 nike

我有一个看起来像这样的数据框

  TaskID Status         Time         
0 123 Progress 12.00
1 234 Progress 12.10
2 123 Almost Done 12.20
3 234 Completed 12.40

我需要使用最新记录更新记录的状态,而不更改其他列的值并删除最新的重复记录。

最终结果

   TaskID Status         Time         
0 123 Almost Done 12.00
1 234 Completed 12.10

我怎样才能实现这个目标?谢谢。

最佳答案

我相信您需要通过 agg 进行聚合与 firstlast :

df = df.groupby('TaskID', as_index=False).agg({'Status':'last','Time':'first'})
print (df)
TaskID Status Time
0 123 Almost Done 12.0
1 234 Completed 12.1

关于python - python 数据框删除重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53719166/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com