gpt4 book ai didi

R中基于大数据集中重复数据不足的行删除

转载 作者:行者123 更新时间:2023-12-04 12:27:40 25 4
gpt4 key购买 nike

我希望对大量数据进行 4 天的滚动平均。问题是有些人没有 4 个案例,因此我收到一个错误,表明 k <= n 不是 TRUE。

有没有办法删除数据集中没有足够数据的任何个人?

以下是数据外观的示例:

     Name  variable.1
1 Kim 64.703950
2 Kim 926.339849
3 Kim 128.662977
4 Kim 290.888594
5 Kim 869.418523
6 Bob 594.973849
7 Bob 408.159544
8 Bob 609.140928
9 Joseph 496.779712
10 Joseph 444.028668
11 Joseph -213.375635
12 Joseph -76.728981
13 Joseph 265.642784
14 Hank -91.646728
15 Hank 170.209746
16 Hank 97.889889
17 Hank 12.069074
18 Hank 402.361731
19 Earl 721.941796
20 Earl 4.823148
21 Earl 696.299627

最佳答案

如果您的数据框是 df ,您可以使用 dplyr 删除出现次数少于 4 次的所有名称。 :

library(dplyr)

df %>%
group_by(Name) %>%
filter(n() >= 4)

关于R中基于大数据集中重复数据不足的行删除,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30085388/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com