gpt4 book ai didi

r - 使用每个输入变量的多个输出变量跨 case_when 进行变异

转载 作者:行者123 更新时间:2023-12-04 16:37:42 24 4
gpt4 key购买 nike

我有一个大数据框(下面是一个小样本),我需要根据某些条件将所有以相同前缀开头的列转换为多个列,保留原始变量并将原始后缀携带到新变量。

数据:

egp <= structure(list(EGP_2007 = structure(c("", "", "II", "", "", "", "", "", "V", "VI"), format.sas = "$"), 
EGP_2008 = structure(c("", "", "IIIb", "", "", "", "IIIb", "", "V", "VI"), format.sas = "$"),
EGP_2009 = structure(c("", "", "IIIb", "", "", "", "I", "II", "V", "I"), format.sas = "$"),
EGP_2010 = structure(c("", "", "", "", "", "I", "", "II", "V", "I"), format.sas = "$"),
EGP_2011 = structure(c("I", "II", "", "", "", "I", "", "II", "V", "I"), format.sas = "$"),
EGP_2012 = structure(c("I", "II", "", "", "I", "VIIb", "I", "II", "I", "I"), format.sas = "$"),
EGP_2013 = structure(c("I", "II", "", "", "I", "VIIb", "IIIa", "II", "I", "I"), format.sas = "$"),
EGP_2014 = structure(c("I", "II", "", "IIIb", "I", "VIIb", "IIIa", "II", "I", "I"), format.sas = "$"),
EGP_2015 = structure(c("I", "IIIa", "", "IIIb", "I", "VIIb", "IIIa", "II", "I", "I"), format.sas = "$"),
EGP_2016 = structure(c("I", "IIIa", "", "IIIb", "I", "", "IIIa", "IIIa", "I", "I"), format.sas = "$"),
EGP_2017 = structure(c("", "", "", "IIIb", "I", "", "IIIa", "II", "I", "I"), format.sas = "$"),
EGP_2018 = structure(c("", "II", "", "IIIb", "I", "", "IIIa", "IIIa", "I", "IIIb"), format.sas = "$")), row.names = c(NA, -10L), class = c("tbl_df", "tbl", "data.frame"))

我尝试了什么:

我试过 adatp this SO answer针对我的问题,但出现以下错误:

Error: Problem with `mutate()` input `..1`. x Can't convert a double vector to function i Input `..1` is `across(...)`.

这是我的代码:

egp_2 <- egp %>% 
mutate(across(contains("EGP"),
.fns = list(professional = case_when(. %in% c("I", "II") ~ 1,
. %in% c("IIIa", "IIIb", "V", "VI", "VIIa", "VIIb") ~ 0,
T ~ NA_real_),
routine_non_manual = case_when(. %in% c("IIIa", "IIIb", "V") ~ 1,
. %in% c("I", "II", "VI", "VIIa", "VIIb") ~ 0,
T ~ NA_real_),
manual = case_when(. %in% c("VI", "VIIa", "VIIb") ~ 1,
. %in% c("I", "II", "IIIa", "IIIb", "V") ~ 0,
T ~ NA_real_)),
.names = "{fn}_{col}" ))

感谢任何解决方案。原始变量包含职业分类,我想将其转换为用于绘图和回归的子类型虚拟变量。

最佳答案

我们需要匿名函数

 egp %>% 
mutate(across(contains("EGP"),
.fns = list(professional = ~ case_when(. %in% c("I", "II") ~ 1,
. %in% c("IIIa", "IIIb", "V", "VI", "VIIa", "VIIb") ~ 0,
T ~ NA_real_),
routine_non_manual =~ case_when(. %in% c("IIIa", "IIIb", "V") ~ 1,
. %in% c("I", "II", "VI", "VIIa", "VIIb") ~ 0,
T ~ NA_real_),
manual = ~ case_when(. %in% c("VI", "VIIa", "VIIb") ~ 1,
. %in% c("I", "II", "IIIa", "IIIb", "V") ~ 0,
T ~ NA_real_)),
.names = "{fn}_{col}" ))

关于r - 使用每个输入变量的多个输出变量跨 case_when 进行变异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67360222/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com