gpt4 book ai didi

r - 如何创建虚拟变量?

转载 作者:行者123 更新时间:2023-12-04 19:13:26 25 4
gpt4 key购买 nike

我有一个变量是一个因素:

 $ year           : Factor w/ 8 levels "2003","2004",..: 4 6 4 2 4 1 3 3 7 2 ...

我想创建 8 个虚拟变量,命名为“2003”、“2004”等,它们取值为 0 或 1,具体取决于变量“year”采用的值。我能想到的最接近的是
dt1 <- cbind (dt1, model.matrix(~dt1$year - 1) )

但这会带来不幸的后果
  • 虚拟变量被命名为 dt1$year2003,而不仅仅是“2003”、“2004”等
  • 似乎 model.matrix 完全省略了 NA 行(因此,当 year 变量中存在 NA 时,上述命令会因长度不同而失败)。

  • 当然,我可以用更多的代码来解决这些问题,但我喜欢我的代码尽可能简洁(在合理范围内),所以如果有人能提出更好的方法来制作虚拟变量,我会很感激。

    最佳答案

    您可以使用 ifelse()不会省略 na行(但我想您可能不会将其视为“尽可能简洁”):

    dt1 <- data.frame(year=factor(rep(2003:2010, 10)))  # example data

    dt1 <- within(dt1, yr2003<-ifelse(year=="2003", 1, 0))
    dt1 <- within(dt1, yr2004<-ifelse(year=="2004", 1, 0))
    dt1 <- within(dt1, yr2005<-ifelse(year=="2005", 1, 0))
    # ...

    head(dt1)
    # year yr2003 yr2004 yr2005
    # 1 2003 1 0 0
    # 2 2004 0 1 0
    # 3 2005 0 0 1
    # 4 2006 0 0 0
    # 5 2007 0 0 0
    # 6 2008 0 0 0

    关于r - 如何创建虚拟变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12758075/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com