gpt4 book ai didi

python - 如何删除概念重复?

转载 作者:行者123 更新时间:2023-12-04 08:38:11 24 4
gpt4 key购买 nike

我必须处理一个类似于这个的数据集:

    Player  CurrentTeam  PreviousTeam
0 James Team A Null
1 David Team B Null
2 George Team C Null
3 James Team B Team A
4 James Team C Team B
... ...
在上面的例子中,詹姆斯实际上是同一个球员,在数据集中出现了 3 次。没有身份证之类的东西。
这里发生的事情是,詹姆斯实际上是在为 C 队效力。在 C 队之前,他在 B 队,甚至在他在 A 队(他的职业生涯开始的地方)之前。
不过,我只需要知道他的 真实当前团队(即团队 C)。
我可以摆脱詹姆斯过去球队的所有其他事件吗?

最佳答案

基于 this answer 中的技术我们可以摆脱作为 (player, previousteam) 组合存在的任何 (player, current_team) 组合。

>>> df
Player CurrentTeam PreviousTeam
0 James Team A Null
1 David Team B Null
2 George Team C Null
3 James Team B Team A
4 James Team C Team B

>>> old_teams = df[["Player", "PreviousTeam"]].rename(columns={"PreviousTeam": "Team"})
>>> all_teams = df[["Player", "CurrentTeam"]].rename(columns={"CurrentTeam": "Team"})
>>> current_teams = (pd.merge(all_teams, old_teams, indicator=True, how="outer")
.query("_merge == 'left_only'")
.drop("_merge", axis=1)
.reset_index(drop=True))
>>> current_teams
Player Team
0 David Team B
1 George Team C
2 James Team C

关于python - 如何删除概念重复?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64693949/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com