gpt4 book ai didi

python - 根据列 value_counts (pandas) 过滤数据框

转载 作者:行者123 更新时间:2023-11-28 21:41:52 24 4
gpt4 key购买 nike

我是第一次尝试 pandas。我有一个包含两列的数据框:user_idstring。每个 user_id 可能有几个字符串,因此多次出现在数据框中。我想从中导出另一个数据框;其中只有那些 user_ids 被列出,至少有 2 个或更多 strings 与之关联。

我尝试了 df[df['user_id'].value_counts()> 1],我认为这是执行此操作的标准方法,但它会产生 IndexingError: Unalignable boolean Series提供的 key 。有人可以清除我的概念并提供正确的选择吗?

最佳答案

我想你需要transform ,因为需要与 df 相同的掩码 index。但是,如果使用 value_counts index 发生更改,则会引发错误。

df[df.groupby('user_id')['user_id'].transform('size') > 1]

关于python - 根据列 value_counts (pandas) 过滤数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44329734/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com