gpt4 book ai didi

r - 如何使用 R 查找数字序列中的所有循环

转载 作者:行者123 更新时间:2023-12-04 11:13:45 25 4
gpt4 key购买 nike

一个数字序列。

seqNum <- sample(1:15, 30, replace = T)
[1] 10 7 6 5 4 1 15 11 7 15 1 2 3 14 8 3 5 10 8 3 14 8 14 3 14 12 15 12 10 14

定义“循环”:从序列中的第一个数字开始,两个之间的所有重复数字被定义为一个循环。例如,上面给定序列中的第一个循环是“7 6 5 4 1 15 11”。从序列中删除它然后重复前面的方法找到下一个循环。
删除第一个循环后的序列变为:

10 15 1 2  3 14  8  3  5 10  8  3  14 8 14  3 14 12 15 12 10 14

第二个循环是“3 14 8”。
删除第二个循环后的序列变为:

10 15 1 2 5 10  8  3  14 8 14  3 14 12 15 12 10 14

第三个循环是“10 15 1 2 5”。删除第三个循环后的序列变为:

8  3  14 8 14  3 14 12 15 12 10 14

第四个循环是“8 3 14”。删除第四个循环后的序列变为:

14 3 14 12 15 12 10 14

第五个循环是“14 12 15 12 10”。(始终使用 2 个最接近的重复数字)删除第五个循环后的序列变为:

14 3

完成。

注意:

  • “loop”必须至少包含3个数字

  • 如果两个循环认为是同一个循环

    1. 包含相同的数字
    2. 相对顺序相同,例如循环“1 2 3 4”与循环“3 4 1 2”或“4 1 2 3”或“2 3 4 1”相同,但不同于循环“1 3 2” 4”或“2 1 3 4”等。

想要:
查找给定序列中的所有循环并给出每个唯一循环的计数。

期望的结果:

  count            loop
1 1 7-6-5-4-1-15-11
2 2 3-14-8
3 1 10-15-1-2-5
4 1 14-12-15-12-10

我知道这是一个很长的问题,但我会很感激任何提示。谢谢!!

PS:这里假设要在很长的数字序列上搜索循环,比如总计大约 10^8,请使用 sample(1:1024, 100000, replace = T) 来测试。

最佳答案

以下代码将按预期查找并打印在该示例上运行的所有“循环”:

seqNum <- c(10, 7, 6, 5, 4, 1, 15, 11,  7, 15,  1,  2,  3, 14,  8,  3,  5, 10,  8,  3,  14, 8, 14,  3, 14, 12, 15, 12, 10, 14)
loops <- matrix(ncol = 2,nrow = 0, dimnames = list(numeric(0),c("count","loop")))

remove_loop <- function(seqNum) {
ht <- new.env()
for(j in 1:length(seqNum)) {
i <- seqNum[j]
key <- as.character(i)
if(exists(key,envir=ht)) {
lastIdx <- ht[[key]]
loop <- seqNum[lastIdx:(j-1)]
if(length(unique(loop)) > 2) {
return(list(loop=loop,newSeqNum=seqNum[-(lastIdx:j)]))
}
}
ht[[key]] <- j
}
}

newSeqNum <- seqNum
repeat{
l <- remove_loop(newSeqNum)
newSeqNum <- l$newSeqNum
if(length(l$loop)){
print(l$loop)
} else {
break
}
}

输出是

[1]  7  6  5  4  1 15 11
[1] 3 14 8
[1] 10 15 1 2 5
[1] 8 3 14
[1] 14 12 15 12 10

它的工作原理是重复删除下一个循环,即在剩余序列上调用函数 remove_loopremove_loop 函数的工作原理如下:使用一个环境作为哈希表(变量 ht),它跟踪每个数字遇到的最后一个索引。如果一个数字至少被第二次看到(即在哈希表中有一个条目),那么可能已经找到了一个“循环”。如果该数字已被看到超过两次(比如 k)次,那么前 (k-1) 次确实不符合“循环”的标准。因此只有当前和最后一次出现是相关的。当前出现在位置 j 并且可以在哈希表中找到先前出现的位置。如果此“循环”包含至少三个不同的数字,则已找到“循环”。

编辑:以下代码计算不同循环的所有出现次数。循环以“规范”形式表示,将它们环绕起来,使它们从最小的元素开始:

repr_loop <- function(l) {
idx <- which.min(l)
if(idx != 1) l <- c(l[idx:length(l)],l[1:(idx-1)])
paste0(l,collapse="-")
}

loops <- data.frame(count=numeric(),loop=character())

newSeqNum <- seqNum
repeat{
l <- remove_loop(newSeqNum)
newSeqNum <- l$newSeqNum
if(length(l$loop)){
s <- repr_loop(l$loop)
idx <- match(s,loops[,"loop"])
if(!is.na(idx)) {
loops[idx,"count"] <- loops[idx,"count"] + 1
} else {
loops <- rbind(loops,data.frame(count=1,loop=s))
}
} else {
break
}
}
loops

产生以下输出

> loops
count loop
1 1 1-15-11-7-6-5-4
2 2 3-14-8
3 1 1-2-5-10-15
4 1 10-14-12-15-12

关于r - 如何使用 R 查找数字序列中的所有循环,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41754452/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com