r - 对 df 中的每个预测变量使用 purrr 映射进行多个线性回归-6ren

r - 对 df 中的每个预测变量使用 purrr 映射进行多个线性回归

转载作者：行者123 更新时间：2023-12-05 02:54:29

25

4

我正在尝试使用一个 Y 变量和许多 x 变量运行许多单独的线性回归。我的数据有 300 多个 x 变量。我一直在尝试用 purrr 和 broom 来做到这一点，但无法弄清楚如何获得我想要的输出。

例子:

iris <- iris %>% 
  select_if(is.numeric)

iris %>% 
  map(~lm(Sepal.Length ~ .x, data = iris)) %>% 
  map(summary) %>% 
  map_df(tidy)

这会产生以下输出:

# A tibble: 6 x 5
  term        estimate std.error statistic   p.value
  <chr>          <dbl>     <dbl>     <dbl>     <dbl>
1 (Intercept)    0      3.79e-17   0.      1.00e+  0
2 .x             1      6.43e-18   1.56e17 0.       
3 (Intercept)    6.53   4.79e- 1   1.36e 1 6.47e- 28
4 .x            -0.223  1.55e- 1  -1.44e 0 1.52e-  1
5 (Intercept)    4.31   7.84e- 2   5.49e 1 2.43e-100
6 .x             0.409  1.89e- 2   2.16e 1 1.04e- 47

这与我要找的很接近，但不完全是!我希望变量名称位于此处的“术语”列中，我不希望为每个模型粘贴截距。我正在寻找的结果更像:

# A tibble: 6 x 5
  term        estimate std.error statistic   p.value
  <chr>          <dbl>     <dbl>     <dbl>     <dbl>
1 Sepal.Width    0      3.79e-17   0.      1.00e+  0
2 Petal.Width    1      6.43e-18   1.56e17 0.       
3 Petal.Length   6.53   4.79e- 1   1.36e 1 6.47e- 28

任何帮助达到这一点将不胜感激!!当然，还要特别感谢对过程的解释(我正在学习)

干杯

最佳答案

lm() 遵循一组称为非标准求值的特殊规则，它在计算中使用部分表达式。这是一个显示差异的简单示例:

a <- "purrr"

print(a)        # Standard evaluation - expression a is evaluated to its value
# [1] "purrr"

library(a)      # Non-standard evaluation - expression a is used as-is
# Error in library(a) : there is no package called ‘a’

同样，lm() 使用表达式 Sepal.Length ~ .x 的部分内容，这就是为什么您会在您的代码中看到 .x输出，而不是 map() 放入 .x 的值。这里有几个选项可以解决这个问题。

选项 1:“手动”构建和计算表达式

colnames(iris) %>%                                # Start with all column names
    setdiff( "Sepal.Length" ) %>%                 # ...that are not Sepal.Length
    rlang::syms() %>%                             # Convert them to symbols
    map( ~rlang::expr(lm(Sepal.Length ~ !!.x,
                         data=iris)) ) %>%        # Create expressions
    map( eval.parent ) %>%                        # Evaluate expressions
    map( broom::tidy ) %>%                        # Tidy up the output
    bind_rows() %>%                               # Combine into a single data frame
    filter( term != "(Intercept)" )               # Drop all (Intercept) entries

在这里，!!.x 将用存储在其中的符号替换 .x。此 map() 步骤的输出将是一组看起来与您想要的完全一样的表达式:

lm(Sepal.Length ~ Sepal.Width, data = iris)
lm(Sepal.Length ~ Petal.Length, data = iris)
lm(Sepal.Length ~ Petal.Width, data = iris)

选项 2:自己注释行

iris %>%
    select( -Sepal.Length ) %>%                   
    map( ~lm(Sepal.Length ~ .x, data=iris) ) %>%    # As before
    map( broom::tidy ) %>%                          # Tidy up the output
    map( filter, term != "(Intercept)" ) %>%        # Remove (Intercept) entries
    map( select, -term ) %>%                        # Remove the default term column
    bind_rows( .id="term" )                         # Make your own from the list names

关于r - 对 df 中的每个预测变量使用 purrr 映射进行多个线性回归，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61793547/

25

4

0

文章推荐： ruby-on-rails - 如何在子类中包含行为？

文章推荐： html - View 中 Angular Material 输入的蓝色背景色

文章推荐： java - 为什么 H2 数据库不在浏览器中显示我的表

r - Purrr-Fection : In Search of An Elegant Solution to Conditional Data Frame Operations Leveraging Purrr
背景我有一个问题，可能有多种解决方案，但我相信有一个尚未发现的优雅解决方案利用 purrr。示例代码我有一个如下的大数据框，为此我在下面提供了一个示例: library(tibble) libr
r - Purrr 的修改函数
我正在尝试使用 purrr 的 modify_in 来修改列表的元素。列表示例: tib_list [[1]] #> # A tibble: 5 x 3 #> col_one col_two c
r - Purrr 和映射向量输出函数
我正在努力了解 purrr，但我正在为一些本应很容易的事情而苦苦挣扎。假设我有以下男性和女性数据 n 0, "M", "F")), value = rnorm(n) ) 现在，我要计算值列的以下
r - Purrr 将函数映射到除一列以外的所有列
我想对“ID”以外的所有列应用 Blom 转换。由于它们都是数字，map_if 和 is.numeric 在这里不起作用。 library(rcompanion) data("mtcars") # G
r - Purrr - 有条件地改变数据框列表中的列
考虑以下数据框列表: library(tidyverse) df1 % set_names(paste0("df", 1:4)) 如果不是这样，我想将 A 和 B 的元素连接到 B 列中。请注意，
通过在 purrr 中按元素求和来减少列表
我正在尝试使用 purrr对具有相同索引的列表元素求和。这可以使用以下方法在基础 R 中实现: xx % reduce(sum)返回单个值。有谁知道在 purrr 中执行此操作的语法吗？ ? 编辑-我
r - Purrr 根据包含字符向量的非嵌套变量过滤嵌套数据
我有类似于df3的数据。要重现数据，请运行以下命令: vec1 % group_by(A) %>% nest() df2 % left_join(df2, by = "A") 我需要使用这样的
r - Purrr ~ 操作符记录在哪里？
我搜索了 ??"~"但这只能指向 rlang::env_bind (大概是 %<~% )和 base::~ .在 RStudio 中，如何找到 Purrr 的 ~的文档？例如，如果我忘记了如何使用 ~
使用 purrr 复制数据框的行
这个问题在这里已经有了答案: Repeat each row of data.frame the number of times specified in a column (9 个回答) 10 个月
使用 purrr 重命名多个数据框列
我有以下数据框列表，其中包含名为 cyl 的列 # Create 3 dataframes with identical column names mt_list [[1]] #>
r - purrr::map中的第一个波浪号是什么意思
我正在查看使用map的example。这里是： mtcars %>% split(.$cyl) %>% # from base R map(~ lm(mpg ~ wt, data = .))
r - purrr 使用模型到数据
我没有看到任何关于我的问题。我想，当我看到 purrr 很多模型示例时，如何再次使用在数据上创建的模型？一点点代码会告诉你我在追求什么: 这是基本的gapminder许多模型示例。 library(g
r - Purrr:哪个嵌套数据框遇到了错误？
这是一个嵌套数据。 df1 % group_by(group) %>% nest() 我需要使用 purrr:map 运行 lm。 map(df2$data, ~lm(A~B, data=.x)) 找
使用 purrr 根据列表名称重命名列表列
我有一个命名列表，在该列表中我想根据列表的来源名称重命名它们的列。我的方法的问题似乎是 .x 占位符，我认为它是我唯一的列表名称。但在 rename_with 函数中，.x 似乎是在每个列表数据框中
在数据帧行上运行 purrr::map_dfr？
给定一个 dataframe，比如 iris 默认值，如何配置 purrr::map_dfr() 函数在的每一行上运行code>dataframe 并执行函数 foo。这是我的 df 的一行，请注
r - purrr 映射未生成整齐的数据
感谢这个网站，我使用 R purrr 包来聚合基于多列的数据。聚合按我想要的方式工作，但输出却不然。以下是使用 mtcars 数据集的示例。 library(dplyr) library(purrr)
r - Purrr:哪个嵌套数据框遇到了错误？
这是一个嵌套数据。 df1 % group_by(group) %>% nest() 我需要使用 purrr:map 运行 lm。 map(df2$data, ~lm(A~B, data=.x)) 找
使用 purrr 根据列表名称重命名列表列
我有一个命名列表，在该列表中我想根据列表的来源名称重命名它们的列。我的方法的问题似乎是 .x 占位符，我认为它是我唯一的列表名称。但在 rename_with 函数中，.x 似乎是在每个列表数据框中
在数据帧行上运行 purrr::map_dfr？
给定一个 dataframe，比如 iris 默认值，如何配置 purrr::map_dfr() 函数在的每一行上运行code>dataframe 并执行函数 foo。这是我的 df 的一行，请注
R (purrr) 将命名列表的列表展平以列出并保留名称
也许我遗漏了一些明显的东西，但我试图将 R 中命名列表的命名列表(甚至可能更多嵌套)扁平化为最终一个扁平列表。 purrr和 rlist似乎有工具。我怎样才能实现子列表的名称成为扁平结果列表的名称预加

首页

博学

6Ren·AI

商城

r - 对 df 中的每个预测变量使用 purrr 映射进行多个线性回归