gpt4 book ai didi

Python机器学习,特征选择

转载 作者:行者123 更新时间:2023-11-28 18:52:49 26 4
gpt4 key购买 nike

我正在处理与书面文本相关的分类任务,我想知道执行某种“特征选择”程序以改进分类结果有多重要。

我正在使用与该主题相关的许多功能(大约 40 个),但我不确定所有功能是否真的相关以及它们的组合。我正在试验 SVM (scikits) 和 LDAC (mlpy)。

如果混合了相关和不相关的特征,我想我会得到很差的分类结果。我应该在分类前执行“特征选择程序”吗?

Scikits 有 an RFE procedure that is tree-based that is able to rank the features .使用基于树的 RFE 对特征进行排序以选择最重要的特征并使用 SVM(非线性)或 LDAC 执行实际分类是否有意义?或者我应该使用相同的分类器实现某种包装方法来对特征进行排名(尝试使用不同的特征组进行分类会非常耗时)?

最佳答案

试试看它是否提高了用 cross validation 测量的分类分数.同样在尝试 RFE 之前,我会尝试 CPU 密集度较低的方案,例如 univariate chi2 feature selection .

关于Python机器学习,特征选择,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9657192/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com