gpt4 book ai didi

Python条件聚合

转载 作者:行者123 更新时间:2023-12-01 08:10:11 24 4
gpt4 key购买 nike

我有一个包含超过 3000 个类别标签的大型数据框。我想根据 groupby 计数有选择地重新编码标签。这就像 Excel 中的条件替换。例如:

ID Label   
1 cat
2 dog
3 cat
4 cat
5 dog
6 bird

每个数量:

cat: 3  
dog: 2
bird: 1

逻辑:如果 count <= 2,则将标签更改为“其他”

ID Label   
1 cat
2 other
3 cat
4 cat
5 other
6 other

每个数量:

cat: 3  
other: 3

也许你们中的一些人知道一种更Pythonic的方法来完成同样的事情。也许神秘的 lambda 函数可以帮助...

像往常一样,我已经在这里阅读了很多帖子。

我的 Python 代码看起来像这样:

df['Label'] = df.groupby('Label')['Label'].transform('count')
df['New_Label'] = np.where(df.label <= 2, 'other', df.label)

最佳答案

此代码使用 pd.DataFrame.where() 而不是 np.where() 并在一行中完成:

df.Label = df.Label.where(df.groupby('Label')['Label'].transform('count') > 2, 'other')
print(df)
     Label
ID
1 cat
2 other
3 cat
4 cat
5 other
6 other

关于Python条件聚合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55308274/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com