r - 对水平数据的预测(使用组模型)-6ren

r - 对水平数据的预测(使用组模型)

转载作者：行者123 更新时间：2023-12-04 11:46:05

26

4

我迫切需要帮助:所以我使用 dplyr 按组运行回归。即这样的事情:

regressions <- mtcars %>% group_by(cyl) %>%
do(fit = lm(wt ~ mpg + qsec + gear, .))

我在一个数据框中得到模型，如下所示:

  ##     cyl     fit
  ##   (dbl)   (chr)
  ## 1     4 <S3:lm>
  ## 2     6 <S3:lm>
  ## 3     8 <S3:lm>

现在我想预测更短的新数据(即与我的训练数据的维度不同)，并且具有相同的级别。即 4,6,8 为 cyl。我的问题是:我如何使用 new/testdata 进行预测，以便每个模型仅指它们在我的测试集中的级别。

 so model cyl 4 only uses data 4 cyl to predict 
model cyl 6 uses data 6 cyl to predict
model cyl 8 uses data 8 cyl to predict
and so on and so forth.enter code here

请记住，测试数据包含所有级别/组。

有没有更简单的方法来做到这一点。即按级别进行预测。目前我正在尝试在扫帚包中使用增强，但它并没有真正起作用。它的作用是:它通过我的所有测试数据运行每个模型，同时不考虑级别。

请帮忙!我正在以更大的规模做这件事，需要一些快速有效的东西。

最佳答案

这对 来说可能是个好工作呜呜声连同 dplyr 和整理 . 呜呜声包适用于列表，我相信会取代 do从长远来看。
例如，如果您有一个包含相同变量的测试数据集，我将其命名为 mtcars_test .

mtcars_test = mtcars

您可以根据 cyl 将此数据集拆分为三个部分.

test_split = split(mtcars_test, mtcars_test$cyl)

那么你可以使用 map2运行三个模型以及拆分测试数据以进行预测。请注意，这依赖于模型和数据集列表在相同的圆柱顺序中，所以要小心。

library(purrr)

map2(regressions$fit, test_split, predict)

结果是一个列表。使用 map2_dfr() 使函数的输出看起来更美观，以将输出放入 data.frame 中。 .

map2_dfr(regressions$fit, test_split, 
     function(model, newdata) {
          newdata$pred = predict(model, newdata = newdata)
          newdata
     })

                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb     pred
Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1 2.463345
Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2 2.633560
Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2 3.392781
Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1 1.864082
Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2 1.821926
Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1 1.834495
...

在您的实际情况中，您可能希望在嵌套数据集中得到结果。我无法使用 do() ，但这在 中是可能的dplyr 1.0.0 与 nest_by()并列出输出。 unnest()函数来自整理 .

library(tidyr)

regs2 = mtcars %>%
     nest_by(cyl) %>%
     mutate(fit = list(lm(wt ~ mpg + qsec + gear, data = data)))

使用 map2() 遍历模型和新数据集列表内 mutate() ，数据集必须是未分组的。在取消嵌套之前，我在这里删除了输出中的其他列表列，但这并不是绝对必要的。

regs2 %>%
     ungroup() %>%
     mutate(test_pred = map2(fit, test_split, predict) ) %>%
     select(-data, -fit) %>%
     unnest(test_pred) 

# A tibble: 32 x 2
     cyl test_pred
   <dbl>     <dbl>
 1     4      2.46
 2     4      2.63
 3     4      3.39
 4     4      1.86
 5     4      1.82
 6     4      1.83
 7     4      2.61
 8     4      2.16
 9     4      2.06
10     4      1.74
# ... with 22 more rows

关于r - 对水平数据的预测(使用组模型)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39211068/

26

4

0

文章推荐： t4 - 从 TextTransform.exe 获取参数值到模板中

文章推荐： hosting - Teamcity 作为构建服务器、托管或为其他人付费？

文章推荐： R:似然比检验比较两个模型，但是缺失数据使得两个模型不在同一维度

javascript - 使用 WebScriptEndpoint 使用 javascript 使用 WCF 服务
我在网上搜索但没有找到任何合适的文章解释如何使用 javascript 使用 WCF 服务，尤其是 WebScriptEndpoint。任何人都可以对此给出任何指导吗？谢谢最佳答案这是一篇关于
c - 没有结果!!使用 fork() 使用 dup2 使用 2 个管道运行 execlp()
我正在编写一个将运行 Linux 命令的 C 程序，例如: cat/etc/passwd | grep 列表 |剪切-c 1-5 我没有任何结果 *这里 parent 等待第一个 child (chi
python - 处理文件上传，使用 Pillow 调整大小，使用 SQLAlchemy 存储，使用 Flask 提供文件
所以我正在尝试处理文件上传，然后将该文件作为二进制文件存储到数据库中。在我存储它之后，我尝试在给定的 URL 上提供文件。我似乎找不到适合这里的方法。我需要使用数据库，因为我使用 Google 应用引
excel - 使用 IF 使用 VBA 在单元格中添加公式的问题
我正在尝试制作一个宏，将下面的公式添加到单元格中，然后将其拖到整个列中并在 H 列中复制相同的公式我想在 F 和 H 列中输入公式的数据 Range("F1").formula = "=IF(ISE
使用 OperatorPrecedenceParser 使用 FParsec 解析函数应用程序？
问题类似于this one ，但我想使用 OperatorPrecedenceParser 解析带有函数应用程序的表达式在 FParsec . 这是我的 AST: type Expression =
sql - 使用 sequelize 使用 where 查询编码计数
我想通过使用 sequelize 和 node.js 将这个查询更改为代码取决于在哪里 select COUNT(gender) as genderCount from customers where
bash - 使用 “let”分配Bash失败，使用 “/”
我正在使用GNU bash，版本5.0.3(1)-发行版(x86_64-pc-linux-gnu)，我想知道为什么简单的赋值语句会出现语法错误: #/bin/bash var1=/tmp
javascript - 使用 JavaScript 使用 FOR OF 数组循环时出现错误？
这里，为什么我的代码在 IE 中不起作用。我的代码适用于所有浏览器。没有问题。但是当我在 IE 上运行我的项目时，它发现错误。而且我的 jquery 类和 insertadjacentHTMl 也不
javascript - 使用 javascript 使用 for 属性更改表单标签内容
我正在尝试更改标签的innerHTML。我无权访问该表单，因此无法编辑 HTML。标签具有的唯一标识符是“for”属性。这是输入和标签的结构:
javascript - 使用 jquery 使用 .on() 将事件附加到页面上的动态插入按钮
我有一个页面，我可以在其中返回用户帖子，可以使用一些 jquery 代码对这些帖子进行即时评论，在发布新评论后，我在帖子下插入新评论以及删除按钮。问题是 Delete 按钮在新插入的元素上不起作用，
使用 awk 使用 sha1sum 进行散列
我有一个大约有 20 列的“管道分隔”文件。我只想使用 sha1sum 散列第一列，它是一个数字，如帐号，并按原样返回其余列。使用 awk 或 sed 执行此操作的最佳方法是什么？ Accounti
mysql - 使用 insert into 使用 mysql
我需要将以下内容插入到我的表中...我的用户表有五列 id、用户名、密码、名称、条目。 (我还没有提交任何东西到条目中，我稍后会使用 php 来做)但由于某种原因我不断收到这个错误:#1054 - U
jquery - 将输入字段值修剪为仅字母数字字符/使用 .使用 jQuery
所以我试图有一个输入字段，我可以在其中输入任何字符，但然后将输入的值小写，删除任何非字母数字字符，留下“。”而不是空格。例如，如果我输入: 地球的 70% 是水，-!*#$^^ & 30% 土地输
javascript - 使用 .innerHTML 使用 DOM
我正在尝试做一些我认为非常简单的事情，但出于某种原因我没有得到想要的结果？我是 javascript 的新手，但对 java 有经验，所以我相信我没有使用某种正确的规则。这是一个获取输入值、检查选择
php - 使用 angularjs 使用 where 子句从数据库获取数据
我想使用 angularjs 从 mysql 数据库加载数据。这就是应用程序的工作原理；用户登录，他们的用户名存储在 cookie 中。该用户名显示在主页上我想获取这个值并通过 angularjs
ios - 使用 UITableViewCell 使用 AutoLayout
我正在使用 autoLayout，我想在 UITableViewCell 上放置一个 UIlabel，它应该始终位于单元格的右侧和右侧的中心。这就是我想要实现的目标所以在这里你可以看到我正在谈论的
mysql - 使用 ElasticSearch 使用 or 和运算符搜索多个字段
我需要与 MySql 等效的 elasticsearch 查询。我的 sql 查询: SELECT DISTINCT t.product_id AS id FROM tbl_sup_price t
ios - 使用 Swift 使用 JSON
我正在实现代码以使用 JSON。 func setup() { if let flickrURL = NSURL(string: "https://api.flickr.com/
javascript - 使用 JavaScript 使用 for 循环声明变量
我尝试使用for循环声明变量，然后测试cols和rols是否相同。如果是，它将运行递归函数。但是，我在 javascript 中执行 do 时遇到问题。有人可以帮忙吗？现在，在比较 col.1 和
jquery - 使用 :after 使用 jquery 更改样式
我举了一个我正在处理的问题的简短示例。 HTML代码: 1 2 3 CSS 代码: .BB a:hover{ color: #000; } .BB > li:after {

首页

博学

6Ren·AI

商城

r - 对水平数据的预测(使用组模型)