作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在做分类,我有一个关于使用 LDA 进行降维的问题:
是否应该将LDA应用于包括训练和测试数据的整个特征矩阵,然后(在降低数据维度之后)对特征矩阵进行划分以提供用于分类的训练和测试集?这是真的吗?
然后,假设我们需要在应用 LDA 之前对数据进行分区。 如何使用Matlab的内部分类器(如kNN和SVM)对测试数据进行分类?
最佳答案
您应该在列车上生成 LDA,然后将其应用到测试集上。
原因是您不想检查整个处理链对不可见数据的执行情况。如果您在训练/测试中生成 LDA 模型,那么不太重要的信息可能会消失。
实际上,如果您确定了维度数,则应该进行训练/测试/验证拆分。您可以在其中确定训练/测试的最佳维度数。然后在训练和测试合并上构建 LDA+模型,并在验证上进行评估。
关于machine-learning - LDA作为分区之前或之后的降维,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46504688/
我是一名优秀的程序员,十分优秀!