gpt4 book ai didi

python - Python 中文本分类的特征选择

转载 作者:行者123 更新时间:2023-11-30 09:13:01 25 4
gpt4 key购买 nike

我正在使用 scikit-learn 库中的随机森林来解决 python 中的文本分类问题。我想尝试不同的特征选择方法,例如信息增益(IG)或双正态分离(BNS),如本paper中所述。 .

似乎 scikit 中唯一可用的特征选择方法(使用 CountVectorizer 类)是基于文档频率的。其他库中是否有其他方法可用?

最佳答案

有一个特征选择模块,其中包含用于进行单变量选择或递归特征消除的工具:http://scikit-learn.org/dev/modules/feature_selection.html scikit-learn 中没有信息 gane 或 BNS。文档频率不是一种特征选择方法。

关于python - Python 中文本分类的特征选择,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25763408/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com