gpt4 book ai didi

r - 根据来自不同列的值的总和过滤行组

转载 作者:行者123 更新时间:2023-12-04 09:08:20 25 4
gpt4 key购买 nike

我正在尝试过滤掉 R 中的整行,但前提是特定集合的频率加起来不超过 5。

我的数据看起来有点像这样。这是一个我目前称之为“Words”的数据框:

HEADWORD VARIANT FREQUENCY
SWORD sword 2
SWORD swerd 1
SWORD sworde 1
KNIGHT knight 6
KNIGHT kniht 2
KNIGHT knyt 1

我只想要特定词条中频率加起来超过 5 的行。所以在这里,我想保留 KNIGHT 的所有实例,但我想完全摆脱所有 SWORD 行。

我尝试在 dplyr 上执行此操作,但没有成功。这是我试过的代码:

Words1 %>% group_by(HW) %>%  filter(Fr > 5)

最佳答案

我们需要得到'FREQUENCY'的sum,并在按'HEADWORD'分组后的filter中检查是否大于5

Words1 %>% 
group_by(HEADWORD) %>%
filter(sum(FREQUENCY) >5)
# HEADWORD VARIANT FREQUENCY
# <chr> <chr> <int>
#1 KNIGHT knight 6
#2 KNIGHT kniht 2
#3 KNIGHT knyt 1

关于r - 根据来自不同列的值的总和过滤行组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39708720/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com