gpt4 book ai didi

r - 传递带有名称的向量以进行变异以创建多个新列

转载 作者:行者123 更新时间:2023-12-04 13:04:03 25 4
gpt4 key购买 nike

我正在尝试使用包含正确答案的向量重新编码答案。我做了一个 for 循环,在每个循环中创建一个新列(带有编码的答案),使用带有新列可能名称的向量。

但是,似乎 mutate 不接收带有名称的向量。我尝试了一些不同的向量和一些 paste0() 组合,但似乎没有任何效果。

这是我的可复制代码:

library(dplyr)
library(tibble)

correct = c(4, 5, 2, 2, 2, 3, 3, 5, 4, 5, 2, 1, 3, 4, 2, 2, 2, 4, 3, 1, 1, 5, 4, 1, 3, 2)

sub1 = c(3, 5, 1, 5, 4, 3, 2, 5, 4, 3, 4, 4, 4, 1, 5, 1, 4, 3, 3, 4, 3, 2, 4, 2, 3, 4)

df = t(data.frame(sub1))
colnames(df) = paste0("P", 1:26)

new_names = paste0("P", 1:26, "_coded")

for(i in 1:26){


df = as.tibble(df) %>%
mutate(new_names = case_when(.[i] == correct[i] ~ 1,
.[i] != correct[i] ~ 0,
T ~ 9999999))

print(df) # to know what's going on.

}

另外,我知道 .dots 可以在向量中接收名称(我认为),但我不太明白如何在 mutate() 中将它与 case_when 一起使用。

也欢迎使用重新编码的值创建新列的其他方法

更新 :
我的预期输出将是带有 26 个新列的原始数据框,P1_COD:P26_COD 可能值为 1(如果正确)和 0(如果不正确)。

像这样的东西(我刚刚创建了四列,以 1 和 0 为例)。
df %>% 
mutate(P1_COD = 1,
P2_COD = 0,
P3_COD = 1,
P4_COD = 1)

最佳答案

数据的格式不是 dplyr会处理得最好。我建议将您的数据重组为纵向格式,然后 case_when 变得微不足道,不需要 for 循环。

tidyverse.org documentation 上查看有关 tidyr 的其他有关数据格式的文档

这是“纵向”格式的示例,包括您的示例数据。我还添加了一些其他带有随机答案的主题。

library(tidyverse)
responses <- data_frame(
subject = rep(1:3, each = 26),
qNum = rep(1:26, 3),
response = c(sub1,
sample(5, 26, replace = T),
sample(5, 26, replace = T)))

可以创建答案然后合并:
answers <- data_frame(
qNum = 1:26,
answer = correct)
df <- left_join(responses, answers)

接下来,使用 dplyr::case_when 为答案评分:
df <- df %>% mutate(score = case_when(response == answer ~ 1,
TRUE ~ 0))

注意: TRUE ~ 0一开始可能会令人困惑。如果第一个条件为 FALSE,它会告诉如何处理剩余的值。由此产生的 df/tibble:
# A tibble: 26 x 5
subject qNum response answer score
<dbl> <int> <dbl> <dbl> <dbl>
1 1 1 3 4 0
2 1 2 5 5 1
3 1 3 1 2 0
4 1 4 5 2 0
5 1 5 4 2 0
6 1 6 3 3 1
7 1 7 2 3 0
8 1 8 5 5 1
9 1 9 4 4 1
10 1 10 3 5 0
# ... with 16 more rows

如果要将其转换为“宽”格式,请使用 tidyr::spread :
df %>%
select(-response, -answer) %>%
spread(qNum, score, sep = ".")
# A tibble: 3 x 27
subject qNum.1 qNum.2 qNum.3 qNum.4 qNum.5 qNum.6 qNum.7 qNum.8 qNum.9 qNum.10
* <int> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1 0 1 0 0 0 1 0 1 1 0
2 2 0 0 0 0 1 0 0 0 0 0
3 3 0 0 0 0 1 0 0 0 0 0

关于r - 传递带有名称的向量以进行变异以创建多个新列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44147967/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com