regression - 在 MATLAB 中比较两个线性回归模型-6ren

regression - 在 MATLAB 中比较两个线性回归模型

转载作者：行者123 更新时间：2023-12-02 03:20:30

24

4

我想使用 F 统计量比较两个模型的性能。这是一个可重现的示例和预期结果:

load carbig
tbl = table(Acceleration,Cylinders,Horsepower,MPG);

% Testing separetly both models
mdl1 = fitlm(tbl,'MPG~1+Acceleration+Cylinders+Horsepower');
mdl2 = fitlm(tbl,'MPG~1+Acceleration');

% Comparing both models using the F-test and p-value
numerator = (mdl2.SSE-mdl1.SSE)/(mdl1.NumCoefficients-mdl2.NumCoefficients);
denominator = mdl1.SSE/mdl1.DFE;
F = numerator/denominator;
p = 1-fcdf(F,mdl1.NumCoefficients-mdl2.NumCoefficients,mdl1.DFE);

我们最终得到 F = 298.75 和 p = 0，表明 mdl1 明显优于 mdl2，正如 F 统计量所评估的那样。

有没有办法在不执行两次 fitlm 并进行所有计算的情况下获得 F 和 p 值？

我尝试运行 coefTest ，正如@Glen_b 所建议的那样，但是该函数的文档记录很差，结果也不是我所期望的。

[p,F] = coefTest(mdl1); % p = 0, F = 262.508  (this F test mdl1 vs constant mdl)
[p,F] = coefTest(mdl1,[0,0,1,1]); % p = 0, F = 57.662 (not sure what this is testing)
[p,F] = coefTest(mdl1,[1,1,0,0]); % p = 0, F = 486.810 (idem)

我认为我应该使用函数 [p,F] = coeffTest(mdl1,H,C) 对不同的零假设 (C) 进行检验。但我真的不知道该怎么做，也没有例子。

最佳答案

这个答案是关于比较两个线性回归模型，其中一个模型是另一个模型的限制版本。

简答:

要对估计的系数向量 b 的第 3 和第 4 个元素为零的限制进行 F 检验:

[p, F] = coefTest(mdl1, [0, 0, 1, 0; 0, 0, 0, 1]);

进一步说明:

让 b 成为我们估计的向量。 b 上的线性限制通常写成矩阵形式:R*b = r。 b 的第 3 和第 4 个元素为零的限制将写为:

[0, 0, 1, 0    *    b    = [0
 0, 0, 0, 1]                0];

矩阵[0, 0, 1, 0; 0, 0, 0, 1] 是 coefTest 在文档中调用的 H 矩阵。

P = coefTest(M,H), with H a numeric matrix having one column for each
    coefficient, performs an F test that H*B=0, where B represents the
    coefficient vector.

长版

有时使用这种计量经济学例程，最好自己写出来，这样您就知道到底发生了什么。

删除带有 NaN 的行，因为它们只会增加不相关的复杂性:

tbl_dirty = table(Acceleration,Cylinders,Horsepower,MPG);
tbl = tbl_dirty(~any(ismissing(tbl_dirty),2),:);

进行估算等...

n = height(tbl);  % number of observations
y = tbl.MPG;
X = [ones(n, 1), tbl.Acceleration, tbl.Cylinders, tbl.Horsepower];
k = size(X,2);     % number of variables (including constant)

b = X \ y;                 % estimate b with least squares
u = y - X * b;             % calculates residuals 
s2 = u' * u / (n - k);     % estimate variance of error term (assuming homoskedasticity, independent observations)
BCOV = inv(X'*X) * s2;     % get covariance matrix of b assuming homoskedasticity of error term etc...
bse = diag(BCOV).^.5;      % standard errors

R = [0, 0, 1, 0;
     0, 0, 0, 1];

r = [0; 0];          % Testing restriction: R * b = r 

num_restrictions = size(R, 1);
F = (R*b - r)'*inv(R * BCOV * R')*(R*b - r) / num_restrictions;   % F-stat (see Hiyashi for reference)

Fp = 1 - fcdf(F, num_restrictions, n - k);  % F p-val

供引用，可以看p。 Hiyashi 的《计量经济学》一书第 65 页。

关于regression - 在 MATLAB 中比较两个线性回归模型，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33904074/

24

4

0

文章推荐： r - 将重复项移动到新列中

文章推荐： stripe-payments - 如何在订单中指定增值税？

文章推荐： thymeleaf - 为 Thymeleaf 的内联 Javascript 指定双引号

"RuntimeError: You must train on the training inputs! " When I'm trying to use mini batch in training Guassian Process Regression Model(“RuntimeError：你必须在训练输入上训练！which is the most important part of the Process Regression Model.“)
我已经编写了一段代码来训练Guassian过程回归模型来预测年龄。我已经编写了以下代码，并且运行良好：。但我注意到，每个纪元都输入了相同的数据，我认为这可能会导致过度拟合，所以我想使用Mini Bat
regression - 计算特定特异性值的截止值和灵敏度？
计算多个回归模型后，我想计算灵敏度值和预先指定的特异性值(即 0.99、0.90、0.85 等)的截止值，以找到最佳模型。我已经创建了代码来计算给定截止值(从 0.1 到 0.9)的灵敏度和特异性，但
regression - 可以检查weka中逻辑回归分类器学习的权重吗？
我正在训练 Weka 的逻辑回归分类器，并试图弄清楚幕后发生了什么。我知道我可以使用分类器使用 logistic.distributionForInstance 查看每个实例的置信度分布方法但是有没有
regression - 朴素贝叶斯回归
我想知道是否可以将朴素贝叶斯应用于回归问题，以及该如何解决。我有4096个图像功能和384个文本功能，而且，如果我假设它们之间是独立的，那也不会很糟糕。谁能告诉我如何进行？最佳答案朴素贝叶斯用于字
regression - 如何获得p值的更多数字？
有人知道运行Tobit回归时让Stata显示p值不止三位数的简单方法吗？通常，Stata报告p值为.001或.065，但我希望看到更多数字，例如.0011123或.065320。明确地说，我不想(
regression - 如何在XGBoost回归器中找到模型系数？
在XGBoost回归中预测价格，如何获取系数，模型的截距？像我们在Statsmodel中获得线性回归一样，如何获取模型摘要？见下面的代码 from xgboost import XGBRegress
regression - RSE和MSE有什么区别？
我正在阅读Hastie和Tibshirani撰写的R中的统计学习入门。我遇到了两个概念:RSE和MSE。我的理解是这样的: RSE = sqrt(RSS/N-2) MSE = RSS/N 现在，我正在
regression - 为什么这个模型会失败？
这是数据集 https://gist.github.com/kirkstrobeck/d8b768867890807f9dc9 当使用 Google Prediction API 时，它将从 RUNN
regression - 软件回归测试中不同回归错误的定义是什么？
在对软件进行回归测试时出现 3 个回归错误。 “本地”、“未屏蔽”和“远程”。有谁知道每一个的定义？谢谢最佳答案以防万一像我这样的人需要这个答案: 本地:新编写的代码中出现错误。揭露:新编写的代
regression - 在Python中模拟回归线的数据
如果我有一条回归线和一个 r 平方，是否有一个简单的 numpy (或其他一些 python 库)命令来随机绘制与回归一致的 x 的 y 值？您可以用同样的方式从分布中抽取随机值吗？谢谢! 编辑:我
regression - 普通最小二乘回归给出错误的预测
我正在使用 statsmodels OLS 将一系列点拟合成一条线: import statsmodels.api as sm Y = [1, 2, 3, 4, 5, 6, 7, 8, 9, 11,
regression - kdb 中的线性回归
这就是我构建线性回归的方式，但是当我包含两列以上时，我的代码不起作用。 // Load relevant columns into memory // t:?[`data;enlist(=;`date
linear-regression - 拟合回归后如何使用Seaborn的residplot？
我在 Python 中有一个简单的线性多元回归，如下所示: X_train,X_test,y_train,y_test=train_test_split(x_cols,df['Volume'],tes
regression-testing - 管理回归
我天生就是一个冲动的编码员，并且已经开始在编程中通过艰难的方式学习耐心的美德。我表现不佳的领域之一是在修改现有代码时。如果我没有在我面前列出所有的细节，我总是会错过某些有时会导致倒退的途径。在我阅读“
linear-regression - Java非负多元线性回归库
我正在做一个 Java 项目，我必须计算一个多元线性回归，但我希望得到的参数是非负的。是否有现有的商业友好许可图书馆来做这样的事情？我一直在寻找非负最小二乘库，但没有成功。最佳答案好吧，我找不到任
linear-regression - 权重变化时有效重新计算加权最小二乘回归
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 2年前关闭。 Improve thi
linear-regression - 我们应该如何处理高度相关的特征？
在我的数据集中 2 个特征 C1和 C2是高度相关的。我做了以下步骤。您能否让我知道它是否正确且有意义？你有更好的方法吗？首先我使用线性模型来找到拟合线: C1=a*C2+b from sklear
regression - "mean_squared_error"的负值
我正在使用 scikit 并使用 mean_squared_error 作为 cross_val_score 中模型评估的评分函数。 rms_score = cross_validation.cros
regression - Logit 模型和逻辑回归之间的区别？
我知道这两个模型有不同的方程，但我不确定为什么人们使用 logistic 模型而不是 logit 模型，反之亦然？其背后的主要原因是什么？如果我的响应变量是一个决策变量(是，否)，那么这里哪个模型会更
regression - Julia 混合效应模型中随机斜率的相互作用
LMM 中的随机效应是否有可能相互作用适合 Julia？这会产生错误 model = fit!(lmm(@formula(response ~ 1 + A*B + (1+A*B|sub)), dat

首页

博学

6Ren·AI

商城

regression - 在 MATLAB 中比较两个线性回归模型

简答:

进一步说明:

长版