gpt4 book ai didi

Python 数据框删除出现频率较低的行

转载 作者:行者123 更新时间:2023-12-05 08:38:24 25 4
gpt4 key购买 nike

<分区>

我有一个数据框,其中重复出现的行具有不同的名称。我想删除较少出现的行。我的数据框很大。我在这里只给出了一个小尺寸。

数据框:

df = 
name value
0 A 10
1 B 20
2 A 30
3 A 40
4 C 50
5 C 60
6 D 70

在上面的数据框中,B 行和 D 行出现的次数较少。小于 1。我想删除/删除所有出现小于 2 的此类行。

我的代码:

##### Net strings
net_strs = df['name'].unique().tolist()
strng_list = df.group.unique().tolist()
tempdf = df.groupby('name').count()
##### strings that have less than 2 measurements in whole data set
lesstr = tempdf[tempdf['value']<2].index
##### Strings that have more than 2 measurements in whole data set
strng_list = np.setdiff1d(net_strs,lesstr).tolist()
##### Removing the strings with less measurements
df = df[df['name']==strng_list]

我现在的输出:

ValueError: Lengths must match to compare

我的预期输出:

         name     value
0 A 10
1 A 30
2 A 40
3 C 50
4 C 60

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com