gpt4 book ai didi

python - 如何根据各种过滤器过滤掉重复项

转载 作者:行者123 更新时间:2023-12-01 08:01:56 25 4
gpt4 key购买 nike

我有一个包含字母、数字和数字列的数据框

df = pd.DataFrame({'Letters':['AB', 'XY', 'ZW','ZW','XY' ],
'Numbers': [1234, 4, 333, 333, 4],
'Digits': [32234, 32534, 4234, 4235, NaN]})

print(df)
Letters Numbers Digits
0 AB 1234 32234
1 XY 4 32534
2 ZW 333 4234
3 ZW 333 4235
4 XY 4 NaN

我想根据特定列(此处为字母和数字)过滤掉重复项,并删除该列具有特定值的行(在本例中,“数字”是最大的或南)

所以结果是

print(df)
Letters Numbers Digits
0 AB 1234 32234
1 XY 4 32534
3 ZW 333 4235

最佳答案

我们可以使用 sort_valuesna_position 参数,然后调用 drop_duplicates:

(df.sort_values('Digits', na_position='first')
.drop_duplicates(['Letters', 'Numbers'], keep='last')
.sort_index())

Letters Numbers Digits
0 AB 1234 32234.0
1 XY 4 32534.0
3 ZW 333 4235.0

关于python - 如何根据各种过滤器过滤掉重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55696241/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com