gpt4 book ai didi

python - 按过滤列对数据框进行子集化

转载 作者:行者123 更新时间:2023-12-01 02:52:08 25 4
gpt4 key购买 nike

我想知道更新我正在使用的数据框的最有效方法是什么。
“位置”列有一些我想过滤掉的位置。我想仅保留包含两个以上项目(> 两行)的位置。 head and tail of df snapshot of unique locations

最佳答案

这可能有点复杂,但它应该可以完成工作。

获取出现次数超过 2 次的所有位置的列表:

counts = df['location'].value_counts()
filt = counts[counts > 2]

过滤原始数据以仅提取出现 >2 次的位置 (keys())

filt2 = df['location'].isin(filt.keys())

应用过滤器

print(df[filt2])

关于python - 按过滤列对数据框进行子集化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44637532/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com