gpt4 book ai didi

python - Pandas 掉落稀有条目

转载 作者:太空宇宙 更新时间:2023-11-04 00:59:44 25 4
gpt4 key购买 nike

我是 Pandas 的新手。为了简化,我有一个包含两列的数据框:product_id 和 rating。每个条目都是对给定产品的新评论。现在我想获得一个新的数据框,其中删除了与收到少于 20 条评论(即在原始数据框中出现少于 20 次)的产品相对应的行。我可以计算出现的次数:

a = data.groupby('product_id').count()
b = a.loc[a['rating']>20]

但这给了我一个一维数据框。显示时,每个 product_id 都有其计数,但我无法访问实际的 product_id 以使用它们来过滤原始表。例如,

b.values

返回计数的一维数组,但不返回 product_id。

最佳答案

您想filter :

a = data.groupby('product_id').filter(lambda x: len(x) > 20)

关于python - Pandas 掉落稀有条目,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33439966/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com