gpt4 book ai didi

python - 如何找到有多个匹配的id?

转载 作者:行者123 更新时间:2023-12-01 01:04:53 24 4
gpt4 key购买 nike

给定一个 CSV 文件(实际上是来自 Kaggle 足球数据的数据集)。如何找出不一对一匹配的“player_fifa_api_id”和“player_api_id”。

player_att.player_fifa_api_id.nunique()
11062

player_att.player_api_id.nunique()
11060

从上面可以看出两者并不相同。

import numpy as np
import pandas as pd
player_att = pd.read_csv('Player_Attributes.csv',sep = ',')
player_att.head()

部分数据如下:

player_fifa_api_id      player_api_id
218353 505942
218353 505942
218353 505942
218353 505942
189615 155782
189615 155782

grouped =player_att.groupby('player_fifa_api_id').count()

即使我对数据进行了分组,它也显示大多数player_fifa_api_id有多个匹配。

player_api_id       player_fifa_api_id  

2625 14
2752 17
2768 17

示例数据显示重复项,但是,某些 player_api_id 具有多个 player_fifa_api_id。谁能告诉我如何找到这个?

最佳答案

例如,如果您只需要获取具有多个对应的player_fifa_api_id的player_api_id,您可以简单地按player_api_id分组,然后获取所有count() > 1的player_api_id。请参阅下面的代码:

grouped_matches = player_att.groupby('player_api_id').count().reset_index()
non_unique_matches = grouped_matches.loc[grouped_matches['player_fifa_api_id']>1]['player_api_id']

上面的代码将输出具有多个player_fifa_api_id的player_api_id列表。您可以对player_fifa_api_id执行相同的操作。

关于python - 如何找到有多个匹配的id?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55446492/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com