gpt4 book ai didi

r - 根据 R 中的列表长度动态创建嵌套的 FOR 循环

转载 作者:行者123 更新时间:2023-12-04 14:46:57 25 4
gpt4 key购买 nike

假设我有一个像这样的数据集 dt:


元猫

单品
价钱
销售量


面包店
面包
796590
22.6
24

面包店
面包
796595
19.8
20

面包店
甜甜圈
796588
30.6
36

面包店
三明治
796640
45.9
42

面包店
三明治
796643
43.3
45

水果
费约亚
645342
97.2
5

水果
橘子
645675
35.7
78

水果
橘子
645677
43.9
65

水果
费约亚
645342
92.9
11


另外,我有一个看起来像这样的列表,例如:

lvl_list <- list(c("meta_cat"),   
c("cat"))
我事先不知道列表中会有多少层(列表长度可以是 0(空列表),也可以是一、二、三等(在我们的例子中,有两层))。列表值对应于数据集中的列名称。
我的任务是根据列表的长度运行嵌套的 for 循环。
如果列表为空,则不会启动循环并执行 main code
如果 列表长度 = 1 ,则应该有 1 个 for 循环,如下所示:
for(i in unique(dt[[lvl_list[[1]]]])){  
dt <- dt[get(lvl_list[[1]]) == I,] # make subset
# run main code
# .
# .
# main code
}
}
因此,在第一次迭代中,我们通过 dt 列的第一个唯一值过滤 meta_cat (例如,仅选择 meta_cat = "bakery" 所在的记录)并在此 main code 上运行 dt
如果列表的长度 = 2,我们应该得到 2 个 for 循环:
for(i in unique(dt[[lvl_list[[1]]]])){
dt <- dt[get(lvl_list[[1]]) == i, ] # filter dt

for(j in unique(dt[[lvl_list[[2]]]])){
dt <- dt[get(lvl_list[[2]]) == j, ] # filter dt again
# run main code
# .
# .
# main code
}
}
所以,这里我们通过两列的值过滤 dt
变量 meta_cat有2个唯一值, cat变量有5个唯一值。
代码执行的逻辑应该是这样的:在第一次迭代时,我们通过 dt 的第一个值过滤 meta_cat(留在 dt 观察中,其中 meta_cat = "bakery" ),在第二次循环的第一次迭代时,我们通过 dt 变量的第一个值(我们将选择 cat 所在的观察值)。因此,我们获得 cat = "bread" ,其中 dtmeta_cat = "bakery" 。此外,此过滤后的 cat = "bread" 用作建模代码的输入。
在第二次迭代中,原始 dtdtmeta_cat = "bakery" 过滤。然后为这个 cat = "doughnut" 执行主代码,以此类推。
如果列表中有 3 个级别,我们应该有 3 个 for 循环,等等。
我的问题: 是否可以根据列表长度动态创建嵌套的 for 循环?
对于如何实现它的任何帮助,我将不胜感激。

最佳答案

使用 split 可能更容易

lst1 <- lapply(split(dt, dt[[lvl_list[[1]]]]), function(x) 
split(x, x[[lvl_list[[2]]]]))

此外,由于这是递归拆分,请使用 rsplit 中的 collapse ,默认情况下会进行递归拆分并返回嵌套列表`
library(collapse)
lst2 <- rsplit(dt, by = dt[, unlist(lvl_list), with = FALSE])
数据
dt <- structure(list(meta_cat = c("bakery", "bakery", "bakery", "bakery", 
"bakery", "fruits", "fruits", "fruits", "fruits"), cat = c("bread",
"bread", "doughnut", "sandwich", "sandwich", "feijoa", "orange",
"orange", "feijoa"), sku = c(796590L, 796595L, 796588L, 796640L,
796643L, 645342L, 645675L, 645677L, 645342L), price = c(22.6,
19.8, 30.6, 45.9, 43.3, 97.2, 35.7, 43.9, 92.9), sales = c(24L,
20L, 36L, 42L, 45L, 5L, 78L, 65L, 11L)), row.names = c(NA, -9L
), class = c("data.table", "data.frame"))

关于r - 根据 R 中的列表长度动态创建嵌套的 FOR 循环,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69844706/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com