gpt4 book ai didi

r - 如何唯一识别变量组中的观察值?

转载 作者:行者123 更新时间:2023-12-04 05:13:02 25 4
gpt4 key购买 nike

我有一个示例数据框“z ”,如下所示:

deaths  sex race    smokes  pyears
10 Female White 0 1410
14 Male White 1 1974
14 Female Black 0 1974
16 Male Black 1 2256
17 Male Black 0 2397
18 Female NA 1 2538
19 NA Black 0 2679
20 Female White 1 2820
20 Female Black 0 2820
21 Male Black 1 2961

我喜欢创建新的变量“ group”,将变量race 和sex 结合起来。这个新变量唯一地标识了 daaframe "z"中的观察组。预期的输出是
 group
1
2
3
4
4
6
5
1
3
4

我想知道我们如何在 R 中编码?

最佳答案

这是我在想的事情:

dat <- read.table(text = "deaths  sex race    smokes  pyears
10 Female White 0 1410
14 Male White 1 1974
14 Female Black 0 1974
16 Male Black 1 2256
17 Male Black 0 2397
18 Female NA 1 2538
19 NA Black 0 2679
20 Female White 1 2820
20 Female Black 0 2820
21 Male Black 1 2961",header = TRUE,sep = "")

dat$sex <- factor(dat$sex,exclude = NULL)
dat$race <- factor(dat$race,exclude = NULL)

with(dat,interaction(sex,race))

[1] Female.White Male.White Female.Black Male.Black Male.Black Female.NA NA.Black Female.White Female.Black
[10] Male.Black
Levels: Female.Black Male.Black NA.Black Female.White Male.White NA.White Female.NA Male.NA NA.NA

看起来您想包含 NA,而不是删除它们,因此显式 factor调用。显然,结果因子可以使用 as.integer 转换为整数。 ,尽管实际数字可能不会按照您指定的顺序排列,因为 R 会按字母顺序排列事物,而不是它们在您的数据框中的显示方式。

关于r - 如何唯一识别变量组中的观察值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14656349/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com