gpt4 book ai didi

python - Scikit-Learn- 如何添加 'unclassified' 类别?

转载 作者:行者123 更新时间:2023-11-28 18:29:15 25 4
gpt4 key购买 nike

我正在使用 Scikit-Learn 使用 LinearSVC 对文本(在我的例子中是推文)进行分类。当文本不适合训练集中定义的任何类别时,有没有办法将文本分类为未分类?例如,如果我有体育、政治和电影的类别,并试图预测关于计算的推文的分类,它应该保持未分类。

最佳答案

在监督学习方法中,您不能添加额外的类别。

因此我会使用一些启发式方法。尝试预测每个类别的概率。那么,如果所有 4 个或至少 3 个概率都近似相等,则可以说该样本是“未知的”。对于这种方法 LinearSVC 或其他类型的支持向量分类器是不好的适合,因为它自然不会给你概率。另一个分类器(逻辑回归、贝叶斯、树、森林)会更好

关于python - Scikit-Learn- 如何添加 'unclassified' 类别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38767481/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com