作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 lda
命令分析一个 2 列、234 行的数据集 (x):X1 列包含预测变量(指标),X2 列包含自变量(分类,4 个类别) ).我想通过使用 150 个观测值构建一个线性判别模型,然后使用其他 84 个观测值进行验证。在对数据进行随机分区后,我得到 x.build 和 x.validation 分别有 150 和 84 个观察值。我运行以下
fit = lda(x.build$X2~x.build$X1, data=x.build, na.action="na.omit")
然后我像这样运行预测命令:
pred = predict(fit, newdata=x.validation)
通过阅读命令描述,我认为在 pred$class
中,我会根据构建的模型获得验证数据的分类,但我得到的是 150 个观测值的分类,而不是 84 个我打算用作验证数据。我真的不知道发生了什么,有人可以给我举个例子说明我应该如何进行这种分析吗?
非常感谢您。
最佳答案
试试这个:
fit = lda(X2~X1, data=x.build, na.action="na.omit")
pred = predict(fit, newdata=x.validation)
如果您在构建模型时使用此公式 x.build$X2~x.build$X1
,则预测预计验证中的 x.build$X1
列数据。显然没有,所以你可以预测训练数据。
关于r - R 中的线性判别分析 - 训练和验证样本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18920679/
我必须在服务器上运行 Excel 并终止我正在使用 taskkill.exe 的 excel.exe 进程: System.Diagnostics.Process.Start("taskkill.ex
我是一名优秀的程序员,十分优秀!