gpt4 book ai didi

python - 减少大型分类变量的级别数

转载 作者:太空宇宙 更新时间:2023-11-04 07:34:38 25 4
gpt4 key购买 nike

是否有一些现成的 python 或 R 库或包可以减少大型分类因子的级别数?

我想实现类似于 R: "Binning" categorical variables 的东西但编码为最常见的 top-k 因子和“其他”。

最佳答案

R 包 forcats 具有用于此目的的 fct_lump()

library(forcats)
fct_lump(f, n)

其中 f 是因子,n 是要保留的最常见级别的数量。其余的重新编码为 Other

关于python - 减少大型分类变量的级别数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39066382/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com