- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
当我使用模型进行预测时遇到问题,R 显示此消息警告消息预测来自排名不足的拟合可能会产生误导
,我该如何解决?我认为我的模型是正确的,但预测失败了,我不知道为什么。
在这里您可以逐步看到我正在做的事情以及模型的摘要:
myModel <- lm(margin~.,data = dataClean[train,c(target,numeric,categoric)])
Call:
lm(formula = margin ~ ., data = dataClean[train, c(target, numeric, categoric)])
Residuals:
Min 1Q Median 3Q Max
-0.220407 -0.035272 -0.003415 0.028227 0.276727
Coefficients: (2 not defined because of singularities)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.061e-01 2.260e-02 26.817 < 2e-16 ***
price 1.042e-05 8.970e-06 1.162 0.245610
shipping 1.355e-03 2.741e-04 4.943 9.25e-07 ***
categoryofficeSupplies -7.721e-02 2.295e-02 -3.364 0.000802 ***
categorytechnology -3.993e-02 2.325e-02 -1.717 0.086249 .
subCategorybindersAndAccessories -1.650e-01 1.421e-02 -11.612 < 2e-16 ***
subCategorybookcases 3.337e-04 2.328e-02 0.014 0.988565
subCategorychairsChairmats -3.104e-02 2.106e-02 -1.474 0.140831
subCategorycomputerPeripherals 1.356e-02 1.293e-02 1.049 0.294604
subCategorycopiersAndFax -1.943e-01 2.944e-02 -6.598 7.27e-11 ***
subCategoryenvelopes -1.648e-01 2.045e-02 -8.057 2.62e-15 ***
subCategorylabels -1.534e-01 1.984e-02 -7.730 3.00e-14 ***
subCategoryofficeFurnishings -8.827e-02 2.220e-02 -3.976 7.61e-05 ***
subCategoryofficeMachines -1.521e-01 1.639e-02 -9.281 < 2e-16 ***
subCategorypaper -1.624e-01 1.363e-02 -11.909 < 2e-16 ***
subCategorypensArtSupplies -8.484e-04 1.524e-02 -0.056 0.955623
subCategoryrubberBands 3.174e-02 2.245e-02 1.414 0.157854
subCategoryscissorsRulersTrimmers 1.092e-01 2.327e-02 4.693 3.13e-06 ***
subCategorystorageOrganization 1.219e-01 1.575e-02 7.739 2.82e-14 ***
subCategorytables NA NA NA NA
subCategorytelephoneAndComunication NA NA NA NA
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.08045 on 858 degrees of freedom
Multiple R-squared: 0.6512, Adjusted R-squared: 0.6439
F-statistic: 88.98 on 18 and 858 DF, p-value: < 2.2e-16
estimateModel <- predict(myModel, type="response", newdata=dataClean[test, c(numeric,categoric,target)])
Warning message:
In predict.lm(myModel, type = "response", newdata = dataClean[test, :
prediction from a rank-deficient fit may be misleading
最佳答案
您的两个子类别级别的相关系数已被抑制。这意味着它们中的每一个都可以通过价格和运输以及其他类别和子类别级别的某种组合进行 100% 预测。这在 R 文档中称为“别名”。该警告可能重要也可能不重要,尽管同意@ZheyuanLi 的观点,即它可能是良性的。我不认为这个特定的警告可能是由于缺失值造成的,因为 R 回归函数通常以一种当任何一个变量具有缺失值时删除整行的方式运行。两个变量之间存在 100% 相关性的理论也不太可能。如果您想查找显示可能导致此问题的组合,我建议从
开始with( dataClean , table( category, SubCategory) )
我预测您会发现一个子类别上有一个或多个类别行。
关于r - 如何解决我的线性模型上的 "rank-deficient fit may be misleading error"问题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40774922/
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
我使用 ggplot2 绘制我的数据并得到错误 “prediction from a rank-deficient fit may be misleading”。看这里: # Data. temp <
当我使用模型进行预测时遇到问题,R 显示此消息警告消息预测来自排名不足的拟合可能会产生误导,我该如何解决?我认为我的模型是正确的,但预测失败了,我不知道为什么。 在这里您可以逐步看到我正在做的事情以及
当我使用模型进行预测时遇到问题,R 显示此消息警告消息预测来自排名不足的拟合可能会产生误导,我该如何解决?我认为我的模型是正确的,但预测失败了,我不知道为什么。 在这里您可以逐步看到我正在做的事情以及
我正在尝试运行一个混合效果模型,该模型使用其余的列作为预测变量来预测F2_difference,但是我收到一条错误消息,内容为 fixed-effect model matrix is rank de
此 R 代码引发警告 # Fit regression model to each cluster y fit$rank 检查 另一种方法是拥有比可用变量更多的参数: fit2 <- lm(y ~
我是一名优秀的程序员,十分优秀!