gpt4 book ai didi

r - 为数据集中两个变量的每个组合保存变量的唯一值

转载 作者:行者123 更新时间:2023-12-05 01:26:45 24 4
gpt4 key购买 nike

我有一个包含三个变量的(大型)数据集。对于 sub1 和 sub2 的每个组合,我想将所有唯一的 IV 保存在单独的向量或数据集中,忽略 id,并使用变量“sub1.and.sub2.IV”命名它。由于我的数据集非常大,我想避免使用 which 并自动提取所有组合。

  id    sub1  sub2  IV   
<chr> <chr> <chr> <chr>
1 3 a a p
2 3 a a f
3 6 a b z
4 6 a b e
5 7 a c b
6 7 a c b

最后,我会得到三个向量或数据集:

> a.and.a.IV
[1] "p" "f"
> a.and.b.IV
[1] "z" "e"
> a.and.c.IV
[1] "b"

MRE示例:

structure(list(id = c("3", "3", "6", "6", "7", "7"), sub1 = c("a", 
"a", "a", "a", "a", "a"), sub2 = c("a", "a", "b", "b", "c", "c"
), IV = c("p", "f", "z", "e", "b", "b")), row.names = c(NA, -6L
), class = c("tbl_df", "tbl", "data.frame"))

最佳答案

也许拆分

> split(df$IV, df[c("sub1","sub2")])
$a.a
[1] "p" "f"

$a.b
[1] "z" "e"

$a.c
[1] "b" "b"

关于r - 为数据集中两个变量的每个组合保存变量的唯一值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70080275/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com