r - data.table 中 mutate_at (dplyr) 的等价物是什么？-6ren

r - data.table 中 mutate_at (dplyr) 的等价物是什么？

转载作者：行者123 更新时间：2023-12-04 09:28:45

25

4

我正在尝试将 dplyr 中的一些较慢的进程移动到使用 data.table，但是似乎无法找到一种在 data.table 中使用“mutate_at”类型方法的有效方法。特别是，在命名创建的新变量并将超过 1 个函数应用于多个列时。

下面我使用 mutate_at 将 2 个不同的函数应用到 2 个具有关联命名的不同列 + 使用 group by 语句。我希望能够在 data.table 中轻松复制它。

library(tibble)
library(zoo)

Data = tibble(A = rep(c(1,2),50),
              B = 1:100,
              C = 101:200)

Data %>% 
    group_by(A) %>% 
    mutate_at(vars(B,C), funs(Roll.Mean.Week = 7 * rollapply(., width = 7, mean, align = "right", fill = 0, na.rm = T, partial = T),
                              Roll.Mean.Two.Week = 7 * rollapply(., width = 14, mean, align = "right", fill = 0, na.rm = T, partial = T))) %>% 
    ungroup()

最佳答案

与 data.table ，我们可以在 .SDcols 中指定感兴趣的列，循环遍历 .SD与 lapply并应用兴趣函数。在这里，函数 rollapply重复，仅更改 width范围。因此，最好创建一个函数以避免重复整个参数。此外，在应用函数 ( f1 ) 时，输出可以保存在 list 中。 , 后来 unlist与 recursive = FALSE并将( := )分配给感兴趣的列

library(data.table)
library(zoo)
nm1 <- c("B", "C")
nm2 <- paste0(nm1, "_Roll.Mean.Week")
nm3 <- paste0(nm1, "_Roll.Mean.Two.Week")
f1 <- function(x, width) rollapply(x, width = width, mean,
        align = "right", fill = 0, na.rm = TRUE, partial = TRUE)
setDT(Data)[, c(nm2, nm3) := unlist(lapply(.SD, function(x)
  list(f1(x, 7), f1(x, 14))), recursive = FALSE), by = A, .SDcols = nm1]
head(Data)
#   A B   C B_Roll.Mean.Week C_Roll.Mean.Week B_Roll.Mean.Two.Week C_Roll.Mean.Two.Week
#1: 1 1 101                1                1                  101                  101
#2: 2 2 102                2                2                  102                  102
#3: 1 3 103                2                2                  102                  102
#4: 2 4 104                3                3                  103                  103
#5: 1 5 105                3                3                  103                  103
#6: 2 6 106                4                4                  104                  104

请注意 funs在 tidyverse 中已弃用在它的位置，可以使用 list(~或只是 ~

Data %>% 
    group_by(A) %>% 
    mutate_at(vars(B,C), list(Roll.Mean.Week =  ~f1(., 7),
                              Roll.Mean.Two.Week = ~ f1(., 14)))%>% 
    ungroup()

关于r - data.table 中 mutate_at (dplyr) 的等价物是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57386580/

25

4

0

文章推荐： wpf - 如何隐藏 WPF 控件的一部分

文章推荐： validation - 覆盖 AngularJS URL 验证器

文章推荐： vb.net - 只接受文本框的数字

文章推荐： r - 将 knitr 整合到您的工作流程中

r - mutate_at 中的复合函数
我有一个问题: df = tibble(one = list('a', 'b'), two = list(c('p1', 'p2', 'p3'), NA_character_), three = li
r - mutate_at 未应用于所有选定的列
我试图从所有其他列中减去一列，但并非所有列都被修改。 test % mutate_at(vars(-a), funs(. - !!as.name(col))) a b c
r - mutate_at 有两组变量
我刚问了a question about generating multiple columns at once with dplyr ，我是个笨蛋，把问题简单化了，还有另一个问题。我想找到一种 dp
使用 mutate_at 的逐行操作
使用 dplyr , 有没有办法在不使用 rowwise() 的情况下逐行选择性地改变列? 例如，给定下面的输入，我想在以“pre_”为前缀的列中用零替换负数: df % rowwise() %
r - 按列位置将函数参数传递给 mutate_at
我正在尝试收紧 %>%管道工作流，我需要将相同的函数应用于多列，但每次更改一个参数。我觉得purrr的 map或 invoke函数应该会有所帮助，但我无法理解它。我的数据框包含预期生命周期、贫困率和
r - mutate_at 在某些情况下不会创建变量后缀？
我一直在玩dplyr::mutate_at通过对某些列应用相同的函数来创建新变量。当我命名我的函数在 .funs参数，mutate 调用创建带有后缀的新列而不是替换现有列，这是我在 this thr
r - Mutate_at ，通过指定列名添加列
这个问题已经有答案了: Create new variables with mutate_at while keeping the original ones (1 个回答) 已关闭 3 年前。我有
r - mutate_at - 涉及两个变量的函数
如果我有这样的数据框 set.seed(1) df % mutate(Y = if_else(X > 10, -Y, Y), Z = if_else(X > 10,
r - mutate_at 在具有不同功能的多组列上
我定义了必须应用于不同数据框列集的函数。例如，mtcars 我想将 as.integer() 函数应用于列 c("mpg", "cyl") 和 >as.logic() 到 c("vs", "am")
r - mutate_at - 涉及两个变量的函数
如果我有这样的数据框 set.seed(1) df % mutate(Y = if_else(X > 10, -Y, Y), Z = if_else(X > 10,
r - mutate_at 用于包含空格的列名
有一个 data.frame (tibble) 如下: require(dplyr) df_org 1 1 A 2 2 B 使用 mutate_at 会抛出以下错误
r - dplyr mutate_at 并一起重命名
我经常遇到必须重新编码遵循相同结构的多个列并将它们保存到具有不同名称的列中的问题。如果我可以覆盖它们，这将只是 dplyr 中的一行，但由于我还想保留原始列，我不知道一个好的解决方案。下图。这将是我
r - 使用函数 mutate_at 没有按预期迭代函数
这个问题在这里已经有了答案: Applying a function to every row of a table using dplyr? (8 个回答) 关闭 3 年前。我有一个列，我希望将其
r - dplyr::mutate_at 使用多个函数
我可以在单个 mutate_at 步骤中在同一列上连续使用多个函数，例如:(sqrt(log(x))) library(dplyr) head(mtcars) %>% select(mpg,
r - 访问 `mutate_at` 中的列名以将其用于子集列表
我正在尝试重新编码几个变量，但使用不同的重新编码方案。重新编码方案保存在一个列表中，其中每个元素都是 old = new 形式的命名向量。每个元素是数据框中每个变量的重新编码方案我正在使用 muta
r - 在 mutate_at() 中访问列名
我正在尝试对 R 中数据框的多个列应用相同的函数。我有一个单独的数据框，其中包含主数据框中的一些列。当主数据框中的列在另一个数据框中时，我想将这两列加在一起，但我似乎无法弄清楚如何访问 mutate
r - 当函数采用不同列的多个参数时使用 dplyr mutate_at
我有一个 data.frame具有大量名称遵循模式的列。如: df % mutate( x = ifelse(is.na(x_1), x_2, x_1), y = ifelse(i
r - dplyr::mutate_at 遍历函数中的列
require(dplyr) df % mutate_at(.vars = col_var, .funs = list(~ ifelse(df[, col_var+1] =
r - 在 mutate_at 中使用列名称向量
这是我的数据: ID a b c d 1 x 1 2 3 2 y 1 2 3 3 z NA NA NA 4 z 1 2 3 5 y NA NA NA 现在，如果我想用 a 组的 b 平均值替
r - 使用 mutate_at 时在函数中使用变量名
我想创建一个函数，可以根据用户提供的输入变量和截止值列表以编程方式添加变量。具体来说，我想定义一个函数 myfun 1

首页

博学

6Ren·AI

商城

r - data.table 中 mutate_at (dplyr) 的等价物是什么？