gpt4 book ai didi

python - Scikit分类比较/排名

转载 作者:行者123 更新时间:2023-12-01 04:44:29 28 4
gpt4 key购买 nike

我是 scikit 新手,我正在按照此处的示例

http://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html#exercise-3-cli-text-classification-utility

但是,我想知道,如果我想要分类的字符串 A 和 B 都被分类在朴素贝叶斯的同一文档组下,我是否能够找出哪个字符串更有可能被分类在文档组下?

例如,如果文档组是“计算机图形”,并且我有一个字符串“Computers are Cool”,另一个字符串“OpenGL 和 CUDA are Cool”,而它们都可能被分类在该文档组下,则第二个字符串string 可能会更强烈地分类在该类别下,因为它的 tf-idf 分数可能更高。有没有办法让我在对它们进行分类后找到它,以便我可以找出哪个字符串更能代表该类别?

最佳答案

scikit 中的许多分类器都有一个方法 predict_proba,它返回给定测试数据落入任何可用输出类别的预测概率。 (例如,Here 是高斯朴素贝叶斯。)您可以使用它来计算模型对分类的置信度。

关于python - Scikit分类比较/排名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29786845/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com