gpt4 book ai didi

machine-learning - 摘录 为什么在分类时选择标签?

转载 作者:行者123 更新时间:2023-11-30 09:10:54 26 4
gpt4 key购买 nike

我目前建立了一个系统,我可以从旧帖子/类别中进行训练,并尝试预测新帖子将属于哪个类别。我使用带有 TfidfVectorizerLinearSVC 的管道来训练数据集并将其存储在 pickle 中,然后通过加载该 pickle 并使用 predict< 来处理新帖子 从加载的 pickle 中对新帖子进行分类。目前,我正在与一些标签作斗争,但我不知道为什么。

我希望提供一些关于每个分类标签的新帖子中触发了哪些单词的输出,以便我可以了解为什么在根据训练集对新数据进行分类时选择某个标签,但我找不到一种方法这样做。

我知道在训练时我可以在矢量化器中输出最重要的特征,但是我如何才能输出选择某个标签而不是另一个标签的原因?

最佳答案

在 SVM 对语料库词汇中每个单词的训练阶段,您将学习每个类别的权重。

然后,在推理过程中,计算类权重与要分类的实例的向量描述之间的点积。该算法返回产生最高点积分数的类。因此,您可以通过检查实例的这些权重(coef_ 属性)来估计事物的工作原理。

不过,我同意其他方法(例如树)更容易解释。

关于machine-learning - 摘录 为什么在分类时选择标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38723161/

26 4 0