- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在对某些数据运行逻辑回归。我的因变量是二元的,除了一个自变量外,其他都是二元的。
当我运行回归时,stata 删除了许多自变量并给出错误:
"variable name" != 0 predicts failure perfectly
"variable name" dropped and "a number" obs not used
我知道一个事实,即丢弃的一些变量并不能完美地预测失败。换句话说,因变量可以为自变量的值 1 或 0 取值 1。
为什么会发生这种情况,我该如何解决?
最佳答案
双变量交叉表未显示问题。试试这个:
http://www.stata.com/support/faqs/statistics/completely-determined-in-logistic-regression/index.html
首先确认这就是正在发生的事情[共线]。 (对于您的数据,将 x1 和 x2 替换为您模型的自变量。)
协变量模式数:
egen pattern = group(x1 x2)
识别只有一个结果的模式:
logit y x1 x2 预测 总结p
完美预测结果的协变量模式可能对研究人员有意义,也可能由于模型中有许多变量而出现异常。
现在您必须消除共线性:
logit y x1 x2 if pattern ~= XXXX//(使用 Tab 步骤中的值)
在移除共线性的情况下重新拟合模型:
logit y x1
您可能想要也可能不想包括完美预测结果的协变量模式。这取决于(3)的答案。如果完美预测结果的协变量模式有意义,您可能希望从模型中排除这些观察结果:
logit y x1 if pattern ~= XXXX
这里有人会报告
协变量模式完美地预测了结果其余数据的最佳模型是....xyz
关于regression - 即使变量之间的相关性不是 1 或 -1,Stata 也会删除 "predicts failure perfeclty"的变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44371631/
我已经编写了一段代码来训练Guassian过程回归模型来预测年龄。我已经编写了以下代码,并且运行良好:。但我注意到,每个纪元都输入了相同的数据,我认为这可能会导致过度拟合,所以我想使用Mini Bat
计算多个回归模型后,我想计算灵敏度值和预先指定的特异性值(即 0.99、0.90、0.85 等)的截止值,以找到最佳模型。我已经创建了代码来计算给定截止值(从 0.1 到 0.9)的灵敏度和特异性,但
我正在训练 Weka 的逻辑回归分类器,并试图弄清楚幕后发生了什么。我知道我可以使用分类器使用 logistic.distributionForInstance 查看每个实例的置信度分布方法但是有没有
我想知道是否可以将朴素贝叶斯应用于回归问题,以及该如何解决。我有4096个图像功能和384个文本功能,而且,如果我假设它们之间是独立的,那也不会很糟糕。谁能告诉我如何进行? 最佳答案 朴素贝叶斯用于字
有人知道运行Tobit回归时让Stata显示p值不止三位数的简单方法吗? 通常,Stata报告p值为.001或.065,但我希望看到更多数字,例如.0011123或.065320。 明确地说,我不想(
在XGBoost回归中预测价格,如何获取系数,模型的截距?像我们在Statsmodel中获得线性回归一样,如何获取模型摘要? 见下面的代码 from xgboost import XGBRegress
我正在阅读Hastie和Tibshirani撰写的R中的统计学习入门。我遇到了两个概念:RSE和MSE。我的理解是这样的: RSE = sqrt(RSS/N-2) MSE = RSS/N 现在,我正在
这是数据集 https://gist.github.com/kirkstrobeck/d8b768867890807f9dc9 当使用 Google Prediction API 时,它将从 RUNN
在对软件进行回归测试时出现 3 个回归错误。 “本地”、“未屏蔽”和“远程”。有谁知道每一个的定义?谢谢 最佳答案 以防万一像我这样的人需要这个答案: 本地:新编写的代码中出现错误。 揭露:新编写的代
如果我有一条回归线和一个 r 平方,是否有一个简单的 numpy (或其他一些 python 库)命令来随机绘制与回归一致的 x 的 y 值?您可以用同样的方式从分布中抽取随机值吗? 谢谢! 编辑:我
我正在使用 statsmodels OLS 将一系列点拟合成一条线: import statsmodels.api as sm Y = [1, 2, 3, 4, 5, 6, 7, 8, 9, 11,
这就是我构建线性回归的方式,但是当我包含两列以上时,我的代码不起作用。 // Load relevant columns into memory // t:?[`data;enlist(=;`date
我在 Python 中有一个简单的线性多元回归,如下所示: X_train,X_test,y_train,y_test=train_test_split(x_cols,df['Volume'],tes
我天生就是一个冲动的编码员,并且已经开始在编程中通过艰难的方式学习耐心的美德。我表现不佳的领域之一是在修改现有代码时。如果我没有在我面前列出所有的细节,我总是会错过某些有时会导致倒退的途径。在我阅读“
我正在做一个 Java 项目,我必须计算一个多元线性回归,但我希望得到的参数是非负的。是否有现有的商业友好许可图书馆来做这样的事情?我一直在寻找非负最小二乘库,但没有成功。 最佳答案 好吧,我找不到任
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 2年前关闭。 Improve thi
在我的数据集中 2 个特征 C1和 C2是高度相关的。我做了以下步骤。您能否让我知道它是否正确且有意义?你有更好的方法吗? 首先我使用线性模型来找到拟合线: C1=a*C2+b from sklear
我正在使用 scikit 并使用 mean_squared_error 作为 cross_val_score 中模型评估的评分函数。 rms_score = cross_validation.cros
我知道这两个模型有不同的方程,但我不确定为什么人们使用 logistic 模型而不是 logit 模型,反之亦然?其背后的主要原因是什么?如果我的响应变量是一个决策变量(是,否),那么这里哪个模型会更
LMM 中的随机效应是否有可能相互作用适合 Julia? 这会产生错误 model = fit!(lmm(@formula(response ~ 1 + A*B + (1+A*B|sub)), dat
我是一名优秀的程序员,十分优秀!