gpt4 book ai didi

r - 将 R 中不太常见的因子级别合并到 "Others"

转载 作者:行者123 更新时间:2023-12-01 23:38:48 25 4
gpt4 key购买 nike

<分区>

我有一个数据框,其中有一个州列,其中包含所有州的值(“阿拉巴马州、阿拉斯加等)”

有没有一种快速的方法来选择前 10 个更频繁的状态,并将所有其他状态替换为“其他”

我通过在州一级按频率进行汇总,创建一个指标来做到这一点

mutate(bottom_40 = ifelse frequency < x, TRUE,FALSE), 

然后加入并使用逻辑将所有状态替换为“其他”的指示符。

这个解决方案很丑陋,如果有人能分享一种更简洁的方法来做到这一点,我将不胜感激。

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com