r - 将多个模型公式应用于数据组-6ren

r - 将多个模型公式应用于数据组

转载作者：行者123 更新时间：2023-12-05 06:39:00

24

4

我想对我的数据应用 3 个线性模型，并为每个模型提取残差。我想知道是否有一种方法可以使用 dplyr 和 purrr 的组合对每个模型应用相同的步骤:

我想保留:

每个模型的lm对象
每个模型的增强输出
每个模型的残差

这是一个分析 mpg 数据集的工作示例:

library(dplyr)
library(tidyr)
library(purrr)
library(broom)
library(ggplot2)

这是我想在我的 lm 中使用的三个不同的公式

f1 = hwy ~ cyl
f2 = hwy ~ displ
f3 = hwy ~ cyl + displ

lin_mod = function(formula) {
  function(data) {
    lm(formula, data = data)
  }
}

这是我为单个公式提取残差的方式:

mpg %>% 
group_by(manufacturer) %>% 
nest() %>% 
mutate(model = map(data, lin_mod(f1)), 
       aug = map(model, augment), 
       res = map(aug, ".resid"))

但是，对于所有公式来说，这种技术似乎是一种糟糕的方法，因为我重写了很多代码:

mpg %>% 
group_by(manufacturer) %>% 
nest() %>% 
mutate(model1 = map(data, lin_mod(f1)), 
       aug1 = map(model1, augment), 
       res1 = map(aug1, ".resid"),
       model2 = map(data, lin_mod(f2)), 
       aug2 = map(model2, augment), 
       res2 = map(aug2, ".resid"),
       model3 = map(data, lin_mod(f3)), 
       aug3 = map(model3, augment), 
       res3 = map(aug3, ".resid"))

如何优雅地将此函数应用于每个公式？我在想 mutate_all，或者将公式放入列表中可能会在某种程度上有所帮助，但可惜我被困住了。

最佳答案

您可以使用 mutate_at(或 mutate_if)就地改变列表列。这节省了几次迭代，并使代码可通过管道传输且更紧凑。

library(dplyr)
library(tidyr)
library(purrr)
library(broom)

lin_mod = function(formula) {
  function(data,...){
  map(data,~lm(formula, data = .x))
  }
}

list_model <- list(cyl_model= hwy ~ cyl,
                   displ_model= hwy ~ displ,
                   full_model= hwy ~ cyl + displ) %>% 
              lapply(lin_mod)

ggplot2::mpg %>% 
  group_by(manufacturer) %>% nest() %>% 
    mutate_at(.vars=("data"),.funs=list_model) %>% 
    mutate_at(.vars=vars(ends_with("model")), .funs=~map(.x, augment)) %>% 
    mutate_at(.vars=vars(ends_with("model")), .funs=~map(.x, ".resid")) %>% unnest()

关于r - 将多个模型公式应用于数据组，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45246430/

24

4

0

文章推荐： pandas - 使用百分比增量创建的 numpy 范围

文章推荐： php - 如何在已加载的页面上生成和显示 TCPDF pdf？

文章推荐： git - 压缩来自其他分支的提交是否安全

Excel If 公式 - 通用错误消息
我对为什么我的 Excel 工作簿中的 if 公式不起作用感到目瞪口呆。像 =if(F2=0, TRUE, FALSE) 这样简单的事情会引发一般错误“这个公式有问题”。不知道在哪里可以解决这个问题
Excel 公式 - 总和从固定点到索引列的相关行
在链接的电子表格中，我试图总结从一月到单元格 B1 中的日期的列 R 类别的所有实例(对于这个例子，让我们说“CAM 收入”)。在这种情况下，总和应该是 ( B7:F7 ) 和 ( B9:F9 )
使用表格中的行和列值查找值的 Excel 公式
这是一个两部分的问题。我想根据价格的生效日期查找商品的价格。我看过垂直生效日期的例子，但我的有点不同。我在第一列 (A) 中有项目。其余列包含带有价格生效日期的标题。希望我能够附上格式示例。我以这种方
用于增加月份的 Excel 公式
我想从第一个单元格开始自动增加月份。 A1 = 2019-01 以下单元格中的公式应自动填充其余单元格。 A2 = 2019-02 : : A13 = 2020-01 有没有一种简单的方法可以做到这一
用于将月份识别为特定年份的一部分的 Excel 公式
在 Excel 中，如果 2021 年是基准年(第 1 年)，并且我正在以月份为单位进行财务模型(但仍想知道该月份对应于哪一年)，我可以使用什么公式来表示月份 0- 12 是第 1 年，第 13-24
excel - 当我想要部分匹配时使用 =IF(OR 公式
我有以下公式，但它不起作用，因为当我在名称周围添加加利福尼亚时它只是失败了，所以它只是告诉我一切都是英国。我怎样才能解决这个问题？ =IF(OR(N10776="*California*",N1077
用于检查文本的 Excel 公式
我有这个公式: =IF(AD491="In progress" OR AD491="Reopened"(ROUND($BW$1-AI491,0),($BW$1-BB491+1)) 它正在检查单元格 A
摘要页的 Excel 公式
我想做一个总结表。我创建了一个名称下拉列表:Bob、Jack、Beth 和一个包含两个选项的下拉列表:已完成或更正待定。在任务旁边的 Sheet2 上，您将选择名称，然后选择两个选项之一。在摘要
返回给定版本字符串的父版本的 Excel 公式
如果我在 A 列中有以下数据: A1 = 3.5.15 A2 = 2.6 A3 = 8.4.3.16.7 我想要一个公式，它可以在下一列 B 中返回以下内容: B1 = 3.5 B2 = 2 B3 =
Excel 公式 - 在单元格上方的行中首次出现部分字符串
我在 Excel 2013 中有一张水果表。我想通过从当前行到顶部搜索直到第一次出现“::”来填充“类别”列，这是表中类别的关键字。如果有某种方法可以反转范围，我可以执行类似 "=Match(":
Excel 公式 - 如何有条件地用另一个表中的值填充列
我这里有 2 张 table : 我要填写Code表 1 中的列，引用表 2。值的条件是开始日期必须在 ProductionDate 之间。和 ExpiryDate表 2 的类型，表 1 中的类型必须
用于输入双周日期的 Excel 公式
我有以下工作表: 网格填充有以下公式(此示例来自单元格 H4)，该公式根据左侧表格中的输入填充网格，=IF($A4="","",IF(AND($E4="Daily",H$2>=$D4,H$2=$D4,
用于生成模式的 Excel 公式
我在 A1 中有以下值。当我向下拖动时，它应该以如下所示的方式增加。 B 应该首先增加，保持 C 不变。一旦 B 达到最大值，即 2，则 C 应该增加。 C 的最大值实际上取决于行号，行号除以 2 或
动态列的 Excel 公式
我会尽我所能理解这一点。我很讨厌把事情说清楚。 :) 所以……就这样…… 我有一张电子表格，上面列出了我种植辣椒的种子。这是我的专栏，我会在后面解释更多。裁剪 |颜色 |一代 |物种 |来源 |斯科
Excel 公式 - 将列表的子字符串匹配到列表
我在 Excel 电子表格中有两个列表。第一个列表有字符串，例如 1234 blue 6 abc xyz blue/white 1234 abc yellow 123 另一个列表包含第一个列表的子字
Excel Sumif 公式
我正在尝试创建一个 SumIf 公式，该公式根据一个标准将多个列添加在一起。 =sumif(F$8:F$58,F73,L$8:L$58+I$8:I$58) 这给了我一个错误，并且不会将两列加在一起。
excel - 公式 "IF ANY"(基本上每个一个)
你好我想知道是否有一个公式相当于每个语句。我知道使用 VBA 可以做到这一点，但鉴于这是一份官方报告，我更愿意让它无宏。基本上我有一个列(假设是 A)，其中包含支付发票的时间 ` |------
频率表的 Excel 公式
任何用于计算频率表中数据平均值(众数、标准差、...)的简单 Excel 公式，如下所示: value frequency 5 3 8 5 4 1
通货膨胀调整返回的 Excel 公式
例如:您希望在 Z# 年的每年年初以今天的美元收到 $X。假设 3% 的恒定通货膨胀率和 7% 的复合年返回率。我知道计算通货膨胀调整后 yield 的公式；对于返回率，您必须使用以下公式: [[(
Excel 公式 ||如何计算列中值的出现次数
需要一些帮助来找出一个公式来计算一个值在列中列出的次数。我将尝试解释下面的要求。下图显示了数据集的示例。要求是列出每个客户的问题和行动。如您所见，即使从单元格中聚集的值中，我们也需要找出各个唯一

首页

博学

6Ren·AI

商城

r - 将多个模型公式应用于数据组