作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在做信用风险建模,数据有大量特征。我正在使用 boruta 包进行特征选择。该包的计算成本太高,我无法在完整的训练数据集上运行它。我想做的是获取训练数据的子集(假设大约 20-30%),并在该子集数据上运行 boruta 包并获取重要特征。但是当我使用随机森林来训练数据时,我也使用完整的数据集。我的问题是,仅在部分训练数据上选择特征,然后在整个训练数据上构建模型是否正确?
最佳答案
由于这个问题本质上是合乎逻辑的,所以我会给我两分钱。
关于r - 特征选择(Boruta),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43757330/
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 6 年前。 Improve this ques
我正在尝试在我的数据集上运行 boruta 特征选择。 代码如下: df boruta.train<-Boruta(as.matrix(X),as.matrix(Y)) Error: Variable
我是一名优秀的程序员,十分优秀!