gpt4 book ai didi

Pandas 无法计算具有重复轴的 isin

转载 作者:行者123 更新时间:2023-12-05 03:02:42 27 4
gpt4 key购买 nike

我的数据框是这样的:

             userid           codeassigned         timestamp
15 553938 M1 1499371200000
15390 527638 M2 1599731200000
15389 521638 M2 1399901200000
15388 521638 M3 1439841200000
15387 553938 M4 1499521200000

我通过以下方式获取了此数据框的一个子集(具有最新时间戳的用户):

df = df.sort_values('timestamp', ascending=False)
mask = df.duplicated('userid')
subset_df = df[~mask]

现在,我想要来自主数据帧的所有行,其中 (userid, timestamp) 在 subset_df 中(可以有多个具有相同 [userid, timestamp] 但分配了不同代码的行);我正在做的事情:

subset_df[['userid', 'timestamp']].isin(df)

但是,我收到了这个错误:

ValueError: cannot compute isin with a duplicate axis.

知道我做错了什么吗?

最佳答案

你需要merge对于过滤子集的内部连接:

subset_df = df.loc[~mask, ['userid', 'timestamp']]

df = subset_df.merge(df)

或者:

df = subset_df[['userid', 'timestamp']].merge(df)

关于 Pandas 无法计算具有重复轴的 isin,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54528757/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com