gpt4 book ai didi

r - 根据条件(唯一值的长度)跨多个列进行变异

转载 作者:行者123 更新时间:2023-12-05 01:24:19 26 4
gpt4 key购买 nike

我正在尝试在 mutate() + across() 中创建一个函数,该函数根据使用的想法将具有五个或更少唯一值(或任意数字)的任何变量更改为因子后来那个因素做了一些分组。我认为该函数的逻辑是正确的,但我遇到了一些不正确的尺寸错误(西类牙语错误)。为了简单起见,我使用的是 mtcars 数据库。

mtcars %>%
mutate(across(1:ncol(.),
function(x) {
if_else(length(unique(x[,i]))<=5,
as.factor(x),
x)}
))

Error: Problem with `mutate()` input `..1`.
i `..1 = across(...)`.
x número incorreto de dimensiones
Run `rlang::last_error()` to see where the error occurred.

如有任何帮助或建议,我们将不胜感激。

最佳答案

这里我们需要 if/else 因为 ifelse/if_else 要求所有参数的长度相等。 length(unique 表达式返回长度为 1 的逻辑值,这可能会破坏条件。此外,对于 dplyr,我们可以使用 select-helperseverything() 选择所有列

library(dplyr)
out <- mtcars %>%
mutate(across(everything(),
function(x) {
if(length(unique(x))<=5)
as.factor(x) else
x}
))

-输出

> str(out)
'data.frame': 32 obs. of 11 variables:
$ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
$ cyl : Factor w/ 3 levels "4","6","8": 2 2 1 2 3 2 3 1 1 2 ...
$ disp: num 160 160 108 258 360 ...
$ hp : num 110 110 93 110 175 105 245 62 95 123 ...
$ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
$ wt : num 2.62 2.88 2.32 3.21 3.44 ...
$ qsec: num 16.5 17 18.6 19.4 17 ...
$ vs : Factor w/ 2 levels "0","1": 1 1 2 2 1 2 1 2 2 2 ...
$ am : Factor w/ 2 levels "0","1": 2 2 2 1 1 1 1 1 1 1 ...
$ gear: Factor w/ 3 levels "3","4","5": 2 2 2 1 1 1 1 2 2 2 ...
$ carb: num 4 4 1 1 2 1 4 2 2 4 ...

此外,lambda函数可以用~简洁,利用n_distinct

mtcars %>% 
mutate(across(everything(),
~ if(n_distinct(.x) <=5) as.factor(.x) else .x))

关于r - 根据条件(唯一值的长度)跨多个列进行变异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71489111/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com