gpt4 book ai didi

r - 使用多个变量过滤多次出现的记录

转载 作者:行者123 更新时间:2023-12-01 10:27:42 24 4
gpt4 key购买 nike

<分区>

我有一个示例数据集。我的目标是保留所有 user_id plan_id 出现不止一次的记录。我知道您可以使用

计算列中变量的频率
n_occur <- data.frame(table(test$user_id))

但如何计算两列中变量的频率,然后根据出现不止一次的变量过滤原始数据集?例如,这是我的测试数据集:

> test
user_id plan_id hour
1 1 10 2
2 2 10 4
3 3 20 23
4 4 20 12
5 5 10 8
6 1 10 10
7 5 20 6
8 1 20 5
9 1 20 18
10 5 10 7
11 1 30 6

这是预期的输出:

> output
user_id plan_id hour
1 1 10 2
2 5 10 8
3 1 10 10
4 1 20 5
5 1 20 8
6 5 10 17

和数据:

> dput(test)
structure(list(user_id = c(1, 2, 3, 4, 5, 1, 5, 1, 1, 5, 1),
plan_id = c(10, 10, 20, 20, 10, 10, 20, 20, 20, 10, 30),
hour = c(2, 4, 23, 12, 8, 10, 6, 5, 18, 7, 6)), .Names = c("user_id",
"plan_id", "hour"), row.names = c(NA, 11L), class = "data.frame")

如有任何建议,我们将不胜感激!

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com