gpt4 book ai didi

r - 编写 tidyeval 函数以重命名 dplyr 中的因子级别

转载 作者:行者123 更新时间:2023-12-02 09:12:32 25 4
gpt4 key购买 nike

我正在尝试编写一个 tidyeval 函数,该函数采用数字列,用 limit 的值替换高于特定 limit 的值,将该列转换为一个因子然后将等于 limit 的因子级别替换为名为“limit+”的级别。

例如,我尝试将 sepal.width 中大于 3 的任何值替换为 3,然后将该因子级别重命名为 3+

作为示例,以下是我尝试使其与 iris 数据集一起使用的方法。不过,fct_recode() 函数没有正确重命名因子级别。

plot_hist <- function(x, col, limit) {
col_enq <- enquo(col)
x %>%
mutate(var = factor(ifelse(!!col_enq > limit, limit,!!col_enq)),
var = fct_recode(var, assign(paste(limit,"+", sep = ""), paste(limit))))
}

plot_hist(iris, Sepal.Width, 3)

最佳答案

要修复最后一行,我们可以使用特殊符号 :=,因为我们需要设置表达式左侧的值。对于 RHS,我们需要强制转换为字符,因为 fct_recode 需要右侧的字符向量。

library(tidyverse)


plot_hist <- function(x, col, limit) {
col_enq <- enquo(col)

x %>%
mutate(var = factor(ifelse(!!col_enq > limit, limit, !!col_enq)),
var = fct_recode(var, !!paste0(limit, "+") := as.character(limit)))
}

plot_hist(iris, Sepal.Width, 3) %>%
sample_n(10)
#> Sepal.Length Sepal.Width Petal.Length Petal.Width Species var
#> 40 5.1 3.4 1.5 0.2 setosa 3+
#> 98 6.2 2.9 4.3 1.3 versicolor 2.9
#> 7 4.6 3.4 1.4 0.3 setosa 3+
#> 99 5.1 2.5 3.0 1.1 versicolor 2.5
#> 76 6.6 3.0 4.4 1.4 versicolor 3+
#> 77 6.8 2.8 4.8 1.4 versicolor 2.8
#> 85 5.4 3.0 4.5 1.5 versicolor 3+
#> 119 7.7 2.6 6.9 2.3 virginica 2.6
#> 110 7.2 3.6 6.1 2.5 virginica 3+
#> 103 7.1 3.0 5.9 2.1 virginica 3+

关于r - 编写 tidyeval 函数以重命名 dplyr 中的因子级别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50516952/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com