gpt4 book ai didi

machine-learning - sklearn : How to add association rules to MultinomialNB for text classification?

转载 作者:行者123 更新时间:2023-11-30 08:35:03 28 4
gpt4 key购买 nike

问题:将用户产品分类为禁止或批准

如果商品包含“濒临灭绝的物种”、“虎皮”等

  • 输入:产品标题+描述
  • 相应标签:已批准/禁止

我使用监督学习算法MultinomialNB对产品进行分类,它的二元组准确率达到92%。

但是我遇到了错误分类的问题,其中“虎皮”产品正在获得批准。原因是我们有很多“虎皮花岗岩/虎皮虾”的产品被标记为认可。

为了解决这个问题,我想创建一些规则以及MultinomialNB算法,以改善这些错误分类。

规则应该是这样的:-如果关键字“tiger”在附近的 3/4 个单词处也有花岗岩/虾,则将其标记/视为已批准。

请在这里帮助我。我怎样才能做到这一点。

最佳答案

您可能想要尝试的一件事是使用另一种类型的分类器,例如 GradientBoostedClassifier,它可以捕获变量之间的交互;这可能会解决你的问题。否则,您可以只使用正则表达式来实现您的自定义规则:

import re
if re.search(tiger (\w+ ){0,4}(prawn|granite),text):
return 'allowed'

关于machine-learning - sklearn : How to add association rules to MultinomialNB for text classification?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34292809/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com