gpt4 book ai didi

r - 使用数值条件对一系列列进行编码

转载 作者:行者123 更新时间:2023-12-05 09:33:08 26 4
gpt4 key购买 nike

我有一系列数字列,范围从 0 到 8。当一行仅一次报告 3 或更多时,我想创建一个二项式变量,而不是编码为“高”,否则为“低”。

structure(list(AE_1 = c(0L, 1L, 0L, 0L, 0L, 2L, 0L), AE_2 = c(0L, 
1L, 2L, 1L, 0L, 0L, 0L), AE_3 = c(1L, 4L, 1L, 8L, 0L, 8L, 1L),
AE_4 = c(0L, 1L, 1L, 0L, 0L, 0L, 0L), AE_5 = c(0L, 0L, 1L,
1L, 0L, 0L, 1L), AE_6 = c(0L, 5L, 1L, 3L, 0L, 4L, 1L), AE_7 = c(0L,
1L, 1L, 1L, 0L, 2L, 0L), AE_8 = c(0L, 2L, 1L, 2L, 0L, 0L,
0L), new_AE = c("low", "low", "low", "low", "low", "low",
"low")), class = "data.frame", row.names = c(NA, -7L))

original data我有这段代码,所有行的结果都很低。


df<-df%>%
mutate(new_AE= pmap_chr(select(., starts_with('AE')), ~
case_when(any(c(...) <= 2) ~ "low" , any(c(...) >=3) ~ "high")))

虽然我想要这样的东西:what I want

最佳答案

这可以通过使用 pmax 检查 base R 中每一行的最大值来轻松完成。现在当然,您不会将 8 个列名称写入 pmax,所以这样做吧。

df[,9] <- c("low", "high")[ 1 + (do.call(pmax, df[,-9]) >= 3)]

> df
AE_1 AE_2 AE_3 AE_4 AE_5 AE_6 AE_7 AE_8 new_AE
1 0 0 1 0 0 0 0 0 low
2 1 1 4 1 0 5 1 2 high
3 0 2 1 1 1 1 1 1 low
4 0 1 8 0 1 3 1 2 high
5 0 0 0 0 0 0 0 0 low
6 2 0 8 0 0 4 2 0 high
7 0 0 1 0 1 1 0 0 low

请参阅 [] 中的 expr 根据您想要的条件返回 true/false

# this returns max of each row
do.call(pmax, df[,-9])
[1] 1 5 2 8 0 8 1

# this checks whether max of each row is 3 or more
do.call(pmax, df[,-9]) >= 3
[1] FALSE TRUE FALSE TRUE FALSE TRUE FALSE

因此,如果您不习惯使用此策略,可以改用replace

df$new_AE <- replace(df$new_AE, do.call(pmax, df[,-9]) >= 3, "high")

关于r - 使用数值条件对一系列列进行编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67442895/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com