gpt4 book ai didi

r - 如何在数据框中查找重复的数字序列

转载 作者:行者123 更新时间:2023-12-04 11:30:18 26 4
gpt4 key购买 nike

假设我有下一个数据框,我想做的是识别和删除某些观察结果。

想法是删除那些具有 4 个或更多相似数字的观测值。

df<-data.frame(col1=c(12,34,233,3333,3333333,333333,555555,543,456,87,4,111111,1111111111,22,222,2222,22222,9111111,912,8688888888))

col1
1 12
2 34
3 233
4 3333
5 3333333
6 333333
7 555555
8 543
9 456
10 87
11 4
12 111111
13 1111111111
14 22
15 222
16 2222
17 22222
18 9111111
19 912
20 8688888888

所以最终的输出应该是:

   col1
1 12
2 34
3 233
4 543
5 456
6 87
7 4
8 22
9 222
10 912

最佳答案

另一种删除所需值的方法是在转换数字后使用 grep() 直接过滤 11112222 等到字符。

df$col1[-as.numeric(grep(paste(1111*(1:9), collapse="|"), as.character(df$col1), value=F))]
# [1] 12 34 233 543 456 87 4 22 222 912

关于r - 如何在数据框中查找重复的数字序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47202645/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com