gpt4 book ai didi

r - 组合两个嵌套列表 R

转载 作者:行者123 更新时间:2023-12-03 03:50:39 24 4
gpt4 key购买 nike

我有一个在数据帧中分层编码的变量。就像这样:

df$variable
[1] "62010" "79110" "69202" "96040" "90010" "59200" ...

现在我想将其更改为列表。就像这样:

 $ :List of 2
..$ : chr "62"
..$ :List of 2
.. ..$ : chr "620"
.. ..$ : List of 2
.. .. ..$ : chr "6201"
.. .. ..$ : List of 1
.. .. .. ..$ : chr "62010"

我已经成功创建了两个两级嵌套列表,方法是:

l1 <- lapply(unique(df$variable)), list)
l2 <- unique(lapply(l1, function(x) substr(x, 1,2)))
l3 <- unique(lapply(l1, function(x) substr(x, 1,3)))
l4 <- unique(lapply(l1, function(x) substr(x, 1,4)))
l5 <- unique(lapply(l1, function(x) substr(x, 1,5)))

l23 <- mapply(list, l2, lapply(l2, function(x) l3[substr(l3,1,2) == x]), SIMPLIFY = FALSE)
l45 <- mapply(list, l4, lapply(l4, function(x) l5[substr(l5,1,4) == x]), SIMPLIFY = FALSE)

这生成了以下内容:

 str(l23)
$ :List of 2
..$ : chr "62"
..$ :List of 1
.. ..$ : chr "620"

str(l45)
$ :List of 2
..$ : chr "6201"
..$ :List of 1
.. ..$ : chr "62010"

对如何合并这两个列表有什么见解吗?或者也许如何以一种完全不同的方式来解决这个问题?

编辑添加了输出:

dput(l1)
list(list("62010"), list("79110"), list("69202"), list("96040"),
list("90010"), list("59200"), list("43320"), list("90020"),
list("46220"), list("90030"), list("70220"), list("86909"),
list("58110"), list("82990"), list("45110"), list("45201"),
list("68203"), list("46720"), list("46510"), list("95290"),
list("85510"), list("68204"), list("41200"), list("74900"),
list("59120"), list("13921"), list("96090"), list("74102"),
list("96022"), list("70210"))

dput(l23)
list(list("62", list("620")), list("79", list("791", "799")),
list("69", list("692", "691")), list("96", list("960")),
list("90", list("900")), list("59", list("592", "591")),
list("43", list("433", "432", "439", "431")), list("46",
list("462", "467", "465", "463", "464", "461", "466")),
list("70", list("702")), list("86", list("869", "862")),
list("58", list("581", "582")), list("82", list("829", "821",
"822", "823")), list("45", list("451", "452", "453")),
list("68", list("682", "683")), list("95", list("952")),
list("85", list("855", "856", "851", "854", "853")), list(
"41", list("412", "411")), list("74", list("749", "741",
"742", "743")), list("13", list("139")), list("47", list(
"479", "475", "472", "476", "477", "471", "474")), list(
"88", list("889", "881")), list("73", list("731")), list(
"71", list("711", "712")), list("66", list("661")), list(
"49", list("494", "493")), list("32", list("329", "324",
"325")), list("63", list("631")), list("10", list("107",
"108")), list("93", list("931", "932")), list("81", list(
"812", "813")))

dput(l45)
list(list("6201", list("62010")), list("7911", list("79110")),
list("6920", list("69202", "69201")), list("9604", list("96040")),
list("9001", list("90010")), list("5920", list("59200")),
list("4332", list("43320")), list("9002", list("90020")),
list("4622", list("46220")), list("9003", list("90030")),
list("7022", list("70220")), list("8690", list("86909", "86905",
"86901")), list("5811", list("58110")), list("8299",
list("82990")), list("4511", list("45110")), list("4520",
list("45201", "45203")), list("6820", list("68203", "68204",
"68201", "68202", "68209")), list("4672", list("46720")),
list("4651", list("46510")), list("9529", list("95290")),
list("8551", list("85510")), list("4120", list("41200")),
list("7490", list("74900")), list("5912", list("59120")),
list("1392", list("13921")), list("9609", list("96090")),
list("7410", list("74102", "74101", "74103")), list("9602",
list("96022", "96021")), list("7021", list("70210")),
list("4791", list("47919", "47912", "47911", "47916", "47914")))

这是我的第一个问题,如果我未能澄清任何问题,请原谅。

编辑因此,为了澄清数根不是唯一的,多个节点将共享一个父节点。以“90010”和“90020”为例。它们都应该组织在“90”的父列表和“900”的子列表中,但然后分成“9001”和“9002”。我添加了一个更大的 dput 来举例说明。不幸的是,之前的较短的 dput 并没有表明这种情况可能发生。抱歉。

最佳答案

我认为这是一种可以满足您需求的方法。由于不知道每个字符串有多长,我将其递归。基本上 to_sublist 接受一个 string_list,即 l1 中看起来像 list("62010) 的元素之一,并开始从底部开始构建层次结构。如果字符串长度超过 2,它会删除一个字符并将其向上一级,然后调用自身继续该过程。然后我们可以将其 lapplyl1 并获得所需的结果。

l1 <- list(list("62010"), list("79110"), list("69202"), list("96040"), list("90010"), list("59200"))

to_sublist <- function(string_list){
string <- string_list[[1]]

if (nchar(string) == 2){
return(string_list)
} else {
substring <- substr(string, 1, nchar(string) - 1)
sublist <- list(substring, string_list)
return(to_sublist(sublist))
}
}

l_out <- lapply(l1, to_sublist)
str(l_out[1:2])
#> List of 2
#> $ :List of 2
#> ..$ : chr "62"
#> ..$ :List of 2
#> .. ..$ : chr "620"
#> .. ..$ :List of 2
#> .. .. ..$ : chr "6201"
#> .. .. ..$ :List of 1
#> .. .. .. ..$ : chr "62010"
#> $ :List of 2
#> ..$ : chr "79"
#> ..$ :List of 2
#> .. ..$ : chr "791"
#> .. ..$ :List of 2
#> .. .. ..$ : chr "7911"
#> .. .. ..$ :List of 1
#> .. .. .. ..$ : chr "79110"

reprex package 创建于 2018-06-07 (v0.2.0)。

--------探索--------

eg1 <- list(
list("12345"),
list("12340"),
list("12300"),
list("12000"),
list("10000")
)
eg2 <- list(
list("1234", list("12345", "12340")),
list("1230", list("12300")),
list("1200", list("12000")),
list("1000", list("10000"))
)
eg3a <- list(
list("123", list("1234", list("12345", "12340"), "1230", list("12300"))),
list("120", list("1200", list("12000"))),
list("100", list("1000", list("10000")))
)
eg3b <- list(
list("123", list("1234", "1230", list("12345", "12340", "12300"))),
list("120", list("1200", list("12000"))),
list("100", list("1000", list("10000")))
)
str(eg1)
#> List of 5
#> $ :List of 1
#> ..$ : chr "12345"
#> $ :List of 1
#> ..$ : chr "12340"
#> $ :List of 1
#> ..$ : chr "12300"
#> $ :List of 1
#> ..$ : chr "12000"
#> $ :List of 1
#> ..$ : chr "10000"
str(eg2)
#> List of 4
#> $ :List of 2
#> ..$ : chr "1234"
#> ..$ :List of 2
#> .. ..$ : chr "12345"
#> .. ..$ : chr "12340"
#> $ :List of 2
#> ..$ : chr "1230"
#> ..$ :List of 1
#> .. ..$ : chr "12300"
#> $ :List of 2
#> ..$ : chr "1200"
#> ..$ :List of 1
#> .. ..$ : chr "12000"
#> $ :List of 2
#> ..$ : chr "1000"
#> ..$ :List of 1
#> .. ..$ : chr "10000"
str(eg3a)
#> List of 3
#> $ :List of 2
#> ..$ : chr "123"
#> ..$ :List of 4
#> .. ..$ : chr "1234"
#> .. ..$ :List of 2
#> .. .. ..$ : chr "12345"
#> .. .. ..$ : chr "12340"
#> .. ..$ : chr "1230"
#> .. ..$ :List of 1
#> .. .. ..$ : chr "12300"
#> $ :List of 2
#> ..$ : chr "120"
#> ..$ :List of 2
#> .. ..$ : chr "1200"
#> .. ..$ :List of 1
#> .. .. ..$ : chr "12000"
#> $ :List of 2
#> ..$ : chr "100"
#> ..$ :List of 2
#> .. ..$ : chr "1000"
#> .. ..$ :List of 1
#> .. .. ..$ : chr "10000"
str(eg3b)
#> List of 3
#> $ :List of 2
#> ..$ : chr "123"
#> ..$ :List of 3
#> .. ..$ : chr "1234"
#> .. ..$ : chr "1230"
#> .. ..$ :List of 3
#> .. .. ..$ : chr "12345"
#> .. .. ..$ : chr "12340"
#> .. .. ..$ : chr "12300"
#> $ :List of 2
#> ..$ : chr "120"
#> ..$ :List of 2
#> .. ..$ : chr "1200"
#> .. ..$ :List of 1
#> .. .. ..$ : chr "12000"
#> $ :List of 2
#> ..$ : chr "100"
#> ..$ :List of 2
#> .. ..$ : chr "1000"
#> .. ..$ :List of 1
#> .. .. ..$ : chr "10000"

reprex package 创建于 2018-06-07 (v0.2.0)。

关于r - 组合两个嵌套列表 R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50745727/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com