r - 如何解决我的线性模型上的 "rank-deficient fit may be misleading error"问题？-6ren

r - 如何解决我的线性模型上的 "rank-deficient fit may be misleading error"问题？

转载作者：行者123 更新时间：2023-12-02 04:03:28

当我使用模型进行预测时遇到问题，R 显示此消息警告消息预测来自排名不足的拟合可能会产生误导，我该如何解决？我认为我的模型是正确的，但预测失败了，我不知道为什么。

在这里您可以逐步看到我正在做的事情以及模型的摘要:

myModel <- lm(margin~.,data = dataClean[train,c(target,numeric,categoric)])

Call:
lm(formula = margin ~ ., data = dataClean[train, c(target, numeric, categoric)])

Residuals:
  Min        1Q    Median        3Q       Max 
-0.220407 -0.035272 -0.003415  0.028227  0.276727 

Coefficients: (2 not defined because of singularities)
                                   Estimate Std. Error t value Pr(>|t|)    
(Intercept)                          6.061e-01  2.260e-02  26.817  < 2e-16 ***
price                                1.042e-05  8.970e-06   1.162 0.245610    
shipping                             1.355e-03  2.741e-04   4.943 9.25e-07 ***
categoryofficeSupplies              -7.721e-02  2.295e-02  -3.364 0.000802 ***
categorytechnology                  -3.993e-02  2.325e-02  -1.717 0.086249 .  
subCategorybindersAndAccessories    -1.650e-01  1.421e-02 -11.612  < 2e-16 ***
subCategorybookcases                 3.337e-04  2.328e-02   0.014 0.988565    
subCategorychairsChairmats          -3.104e-02  2.106e-02  -1.474 0.140831    
subCategorycomputerPeripherals       1.356e-02  1.293e-02   1.049 0.294604    
subCategorycopiersAndFax            -1.943e-01  2.944e-02  -6.598 7.27e-11 ***
subCategoryenvelopes                -1.648e-01  2.045e-02  -8.057 2.62e-15 ***
subCategorylabels                   -1.534e-01  1.984e-02  -7.730 3.00e-14 ***
subCategoryofficeFurnishings        -8.827e-02  2.220e-02  -3.976 7.61e-05 ***
subCategoryofficeMachines           -1.521e-01  1.639e-02  -9.281  < 2e-16 ***
subCategorypaper                    -1.624e-01  1.363e-02 -11.909  < 2e-16 ***
subCategorypensArtSupplies          -8.484e-04  1.524e-02  -0.056 0.955623    
subCategoryrubberBands               3.174e-02  2.245e-02   1.414 0.157854    
subCategoryscissorsRulersTrimmers    1.092e-01  2.327e-02   4.693 3.13e-06 ***
subCategorystorageOrganization       1.219e-01  1.575e-02   7.739 2.82e-14 ***
subCategorytables                           NA         NA      NA       NA    
subCategorytelephoneAndComunication         NA         NA      NA       NA    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.08045 on 858 degrees of freedom
Multiple R-squared:  0.6512,    Adjusted R-squared:  0.6439 
F-statistic: 88.98 on 18 and 858 DF,  p-value: < 2.2e-16

estimateModel <- predict(myModel, type="response", newdata=dataClean[test, c(numeric,categoric,target)])

Warning message:
In predict.lm(myModel, type = "response", newdata = dataClean[test,  :
prediction from a rank-deficient fit may be misleading

最佳答案

您的两个子类别级别的相关系数已被抑制。这意味着它们中的每一个都可以通过价格和运输以及其他类别和子类别级别的某种组合进行 100% 预测。这在 R 文档中称为“别名”。该警告可能重要也可能不重要，尽管同意@ZheyuanLi 的观点，即它可能是良性的。我不认为这个特定的警告可能是由于缺失值造成的，因为 R 回归函数通常以一种当任何一个变量具有缺失值时删除整行的方式运行。两个变量之间存在 100% 相关性的理论也不太可能。如果您想查找显示可能导致此问题的组合，我建议从

开始

with( dataClean , table( category, SubCategory) )

我预测您会发现一个子类别上有一个或多个类别行。

关于r - 如何解决我的线性模型上的 "rank-deficient fit may be misleading error"问题？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40774922/

文章推荐： php - Yii2 从相关模型中获取值(value)

文章推荐： Netsuite API 响应时间较长

文章推荐： mongodb - 分片集合中 mongodb 中的聚合管道

文章推荐： php - 使用 file_get_contents 从 url 获取 JSON

matlab - 警告 : Rank deficient, MATLAB
这个问题不太可能帮助任何 future 的访问者；它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关，这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用，visit
r - geom_smooth() 中的 "prediction from a rank-deficient fit may be misleading"
我使用 ggplot2 绘制我的数据并得到错误 “prediction from a rank-deficient fit may be misleading”。看这里: # Data. temp <
r - 如何解决我的线性模型上的 "rank-deficient fit may be misleading error"问题？
当我使用模型进行预测时遇到问题，R 显示此消息警告消息预测来自排名不足的拟合可能会产生误导，我该如何解决？我认为我的模型是正确的，但预测失败了，我不知道为什么。在这里您可以逐步看到我正在做的事情以及
r - 如何解决我的线性模型上的 "rank-deficient fit may be misleading error"问题？
当我使用模型进行预测时遇到问题，R 显示此消息警告消息预测来自排名不足的拟合可能会产生误导，我该如何解决？我认为我的模型是正确的，但预测失败了，我不知道为什么。在这里您可以逐步看到我正在做的事情以及
r - lme4::lmer报告 “fixed-effect model matrix is rank deficient”，我是否需要修复以及如何解决？
我正在尝试运行一个混合效果模型，该模型使用其余的列作为预测变量来预测F2_difference，但是我收到一条错误消息，内容为 fixed-effect model matrix is rank de
r - 循环中的 predict.lm()。警告 : prediction from a rank-deficient fit may be misleading
此 R 代码引发警告 # Fit regression model to each cluster y fit$rank 检查另一种方法是拥有比可用变量更多的参数: fit2 <- lm(y ~

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

r - 如何解决我的线性模型上的 "rank-deficient fit may be misleading error"问题？