gpt4 book ai didi

r - 如何替换嵌套的 for 循环?

转载 作者:行者123 更新时间:2023-12-04 10:42:04 27 4
gpt4 key购买 nike

Givena 矩阵包含 3 个变量、一个标识符和 2 个数字变量“A”和“B”。我为变量“A”的值定义了某些范围,为“B”定义了其他范围。我想提取并存储验证“A”和“B”变量是否在指定范围内的标识符。

例如,考虑以下示例:

DF = data.frame(identifier = 1:18, A=rep(c(1,2,3,4,5,6), each=3), B=rep(c(11,12,13,14, 15, 16), 3))
interval_a = c(1, 3, 6)
interval_b = c(11, 13, 16)

我有一个数据框,我想提取验证 A 介于 1 和 3 之间,B 介于 11 和 13 之间的标识符。然后,我想要验证 A 介于 1 和 3 之间,B 介于 13 之间的标识符和 16,以此类推。

我知道这可以通过像这样的嵌套 for 循环来完成:
identifier_list = list()
for(i in 1:(length(interval_a)-1))
{
df_tmp = DF[which(DF$A<interval_a[i+1] & DF$A>=interval_a[i]),]
for(j in 1:(length(interval_b)-1))
{

identifier_list[[(length(identifier_list) +1)]] = df_tmp[which(df_tmp$B<interval_b[j+1] & df_tmp$B>=interval_b[j]),'identifier']
}
}

但如果 A 和 B 中要考虑的间隔数量很大,我发现这不切实际。有没有更好的办法?

最佳答案

这是一个 依赖于 1) 创建查找表和 2) 进行非对等连接的方法。

library(data.table)
DF = data.frame(identifier = 1:18, A=rep(c(1,2,3,4,5,6), each=3), B=rep(c(11,12,13,14, 15, 16), 3))
interval_a = c(1, 3, 6)
interval_b = c(11, 13, 16)

# make lookup tables based on the a and b intervals
int_a = data.frame(A_start = interval_a[-length(interval_a)],
A_end = interval_a[-1L])

int_b = data.frame(B_start = interval_b[-length(interval_b)],
B_end = interval_b[-1L])

#all combinations of the two intervals and adding an ID
int_lookup = merge(int_a, int_b, by = NULL)

setDT(int_lookup)
int_lookup[, ID := .I]

int_lookup
#> A_start A_end B_start B_end ID
#> <num> <num> <num> <num> <int>
#> 1: 1 3 11 13 1
#> 2: 3 6 11 13 2
#> 3: 1 3 13 16 3
#> 4: 3 6 13 16 4

# make DF a data.table and do a non-equi join
setDT(DF)
DF[int_lookup,
on = .(A >= A_start,
A < A_end,
B >= B_start,
B < B_end),
comb_ID := ID]

DF
#> identifier A B comb_ID
#> <int> <num> <num> <int>
#> 1: 1 1 11 1
#> 2: 2 1 12 1
#> 3: 3 1 13 3
#> 4: 4 2 14 3
#> 5: 5 2 15 3
#> 6: 6 2 16 NA
#> 7: 7 3 11 2
#> 8: 8 3 12 2
#> 9: 9 3 13 4
#> 10: 10 4 14 4
#> 11: 11 4 15 4
#> 12: 12 4 16 NA
#> 13: 13 5 11 2
#> 14: 14 5 12 2
#> 15: 15 5 13 4
#> 16: 16 6 14 NA
#> 17: 17 6 15 NA
#> 18: 18 6 16 NA

如果我们按 comb_ID 拆分,我们可以获得与您的输出类似的列表。在末尾:
split(DF, by =  'comb_ID')

> split(DF, by = 'comb_ID')
$`1`
identifier A B comb_ID
<int> <num> <num> <int>
1: 1 1 11 1
2: 2 1 12 1

$`3`
identifier A B comb_ID
<int> <num> <num> <int>
1: 3 1 13 3
2: 4 2 14 3
3: 5 2 15 3

$`NA`
identifier A B comb_ID
<int> <num> <num> <int>
1: 6 2 16 NA
2: 12 4 16 NA
3: 16 6 14 NA
4: 17 6 15 NA
5: 18 6 16 NA

$`2`
identifier A B comb_ID
<int> <num> <num> <int>
1: 7 3 11 2
2: 8 3 12 2
3: 13 5 11 2
4: 14 5 12 2

$`4`
identifier A B comb_ID
<int> <num> <num> <int>
1: 9 3 13 4
2: 10 4 14 4
3: 11 4 15 4
4: 15 5 13 4

关于r - 如何替换嵌套的 for 循环?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59877858/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com