gpt4 book ai didi

scala - 如何使用条件删除重复项

转载 作者:行者123 更新时间:2023-12-05 08:54:56 28 4
gpt4 key购买 nike

<分区>

我有以下 DataFrame df:

如何删除重复项,同时保持每个重复的 item_idcountry_idlevel 的最小值。

+-----------+----------+---------------+                                        
|item_id |country_id|level |
+-----------+----------+---------------+
| 312330| 13535670| 82|
| 312330| 13535670| 369|
| 312330| 13535670| 376|
| 319840| 69731210| 127|
| 319840| 69730600| 526|
| 311480| 69628930| 150|
| 311480| 69628930| 138|
| 311480| 69628930| 405|
+-----------+----------+---------------+

预期输出:

+-----------+----------+---------------+                                        
|item_id |country_id|level |
+-----------+----------+---------------+
| 312330| 13535670| 82|
| 319840| 69731210| 127|
| 319840| 69730600| 526|
| 311480| 69628930| 138|
+-----------+----------+---------------+

我知道如何使用 dropDuplicates 无条件删除重复项,但我不知道如何针对我的特定情况执行此操作。

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com