gpt4 book ai didi

python - 从 Pandas 的列中删除数据

转载 作者:行者123 更新时间:2023-11-28 22:28:58 25 4
gpt4 key购买 nike

我正在尝试从我的数据框中删除一些数据,但只删除“To country”列中重复的行

我的数据框是这样的:

   Year From country To country  Points
0 2016 Albania Armenia 0
1 2016 Albania Armenia 2
2 2016 Albania Australia 12
Year From country To country Points
2129 2016 United Kingdom The Netherlands 0
2130 2016 United Kingdom Ukraine 10
2131 2016 United Kingdom Ukraine 5

[2132 rows x 4 columns]

我试了一下:

df.drop_duplicates(subset='To country', inplace=True)

发生的事情是这样的:

   Year From country To country  Points
0 2016 Albania Armenia 0
2 2016 Albania Australia 12
4 2016 Albania Austria 0
Year From country To country Points
46 2016 Albania The Netherlands 0
48 2016 Albania Ukraine 0
50 2016 Albania United Kingdom 5

[50 rows x 4 columns]

虽然这确实删除了重复的“To country”条目,但它也删除了“From country”列的所有值。我一定是错误地使用了 drop_duplicates(),但是 pandas 文档没有帮助我理解为什么它的下降比我预期的要多?

最佳答案

不,这种行为是正确的——假设每支球队都与其他球队比赛,它正在寻找第一名,而所有这些第一名都“来自”阿尔巴尼亚。

根据您在下面所说的,您希望保留第 0 行,而不是第 1 行,因为它重复两者 ToFrom 国家。消除这些的方法是:

df.drop_duplicates(subset=['To country', 'From country'], inplace=True)

关于python - 从 Pandas 的列中删除数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43302679/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com