gpt4 book ai didi

r - 使用 mutate_at 时在函数中使用变量名

转载 作者:行者123 更新时间:2023-12-02 11:17:07 25 4
gpt4 key购买 nike

我想创建一个函数,可以根据用户提供的输入变量和截止值列表以编程方式添加变量。

具体来说,我想定义一个函数

myfun <- function(df, varlist, cutofflist)

返回 df,并为 varlist 中的每个变量添加一列,其中包含每个变量是否至多对应的截止值的逻辑。

例如,假设我们采用虹膜数据帧,

df <- as_tibble(iris)
# A tibble: 150 x 1
iris$Sepal.Length $Sepal.Width $Petal.Length $Petal.Width $Species
<dbl> <dbl> <dbl> <dbl> <fct>
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
7 4.6 3.4 1.4 0.3 setosa
8 5 3.4 1.5 0.2 setosa
9 4.4 2.9 1.4 0.2 setosa
10 4.9 3.1 1.5 0.1 setosa
# ... with 140 more rows

我想打电话

myfun(df, c("Sepal.Length", "Petal.Length"), list(Sepal.Length = 5, Petal.Length = 1.5))

产生相同的结果

df %>%
mutate(
Sepal.Length_indicator = (Sepal.Length <= 5),
Petal.Length_indicator = (Petal.Length <= 1.5)
)

即这个:

# A tibble: 150 x 7
Sepal.Length Sepal.Width Petal.Length Petal.Width Species Sepal.Length_indicator Petal.Length_indicator
<dbl> <dbl> <dbl> <dbl> <fct> <lgl> <lgl>
1 5.1 3.5 1.4 0.2 setosa FALSE TRUE
2 4.9 3 1.4 0.2 setosa TRUE TRUE
3 4.7 3.2 1.3 0.2 setosa TRUE TRUE
4 4.6 3.1 1.5 0.2 setosa TRUE TRUE
5 5 3.6 1.4 0.2 setosa TRUE TRUE
6 5.4 3.9 1.7 0.4 setosa FALSE FALSE
7 4.6 3.4 1.4 0.3 setosa TRUE TRUE
8 5 3.4 1.5 0.2 setosa TRUE TRUE
9 4.4 2.9 1.4 0.2 setosa TRUE TRUE
10 4.9 3.1 1.5 0.1 setosa TRUE TRUE
# ... with 140 more rows

我对使用 quosures 等 dplyr 还很陌生。到目前为止我正在尝试的是以下内容:

myfun <- function(df, varlist, cutofflist){
df %>%
mutate_at(.vars = varlist, .funs = list(indicator = function(x) x<= cutofflist[[?]]))
}

但我不知道应该用什么来替换上面的 ? 。如果所有变量的截止值都相同,则该解决方案有效,但如果截止值取决于变量,则该解决方案无效。

预先感谢您的帮助。

最佳答案

这是 map2transmute 的一个选项

library(tidyverse)
myfun <- function(data, varVec, cutofflist) {
map2_dfc(varVec, cutofflist[varVec], ~

data %>%
transmute( !! paste0(.x, "_indicator") :=
!! rlang::sym(.x) <= .y)) %>%
bind_cols(df, .)

}


out2 <- myfun(df, c("Sepal.Length", "Petal.Length"),
list(Sepal.Length = 5, Petal.Length = 1.5))

-通过在函数外部运行来检查输出

out1 <- df %>%
mutate(
Sepal.Length_indicator = (Sepal.Length <= 5),
Petal.Length_indicator = (Petal.Length <= 1.5)
)

identical(out1, out2)
#[1] TRUE
<小时/>

或者也可以使用 map 来完成,因为“varVec”和“cutofflist”名称相同

myfun <- function(data, varVec, cutofflist) {
map_dfc(varVec, ~

data %>%
transmute( !! paste0(.x, "_indicator") :=
!! rlang::sym(.x) <= cutofflist[[.x]])



) %>%
bind_cols(df, .)

}

关于r - 使用 mutate_at 时在函数中使用变量名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55818915/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com