gpt4 book ai didi

scikit-learn - LinearSVC.coef_ 中的 n_classes 顺序

转载 作者:行者123 更新时间:2023-12-01 05:03:52 24 4
gpt4 key购买 nike

我正在使用 LinearSVC 将文本数据分为 3 类。输入数据是每个单词的 tfidf 分数。我有兴趣看到单词对分类的“贡献”。第一个问题是我可以使用 coef_ 吗?该文件指出:

coef_ : array, shape = [n_features] if n_classes == 2 else [n_classes, n_features]



因此,我假设“n_classes”对应于文档可以分类的 3 个类中的每一个,并且 n_features 是我的 tfidf 特征的系数值。假设是这样,coef_ 中的类的顺序是什么?如何将数组中的每一行与我的一个类匹配?

谢谢,

缺口

最佳答案

在不深入研究源代码的情况下,我相信您的问题有两个答案:

  • 类是排序的。因此,如果您有类(class) ['a', 'b', 'C'],那么您的类(class)顺序将是 ['C','a','b']。 (这可能看起来很奇怪,但是在 Python 和 .sort() 中创建该列表。这就是顺序。)
  • 有一个几乎没有证件的类(class)成员,LinearSVC().classes_ ,它保存类使用的顺序(参见 this method documentation )。
  • 关于scikit-learn - LinearSVC.coef_ 中的 n_classes 顺序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30923147/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com