scikit-learn - LinearSVC 和 SVC(内核 ="linear")有什么区别？-6ren

scikit-learn - LinearSVC 和 SVC(内核 ="linear")有什么区别？

转载作者：行者123 更新时间：2023-12-03 14:35:36

24

4

我找到了 sklearn.svm.LinearSVC 和 sklearn.svm.SVC(kernel='linear') 他们看起来和我很相似，但我在路透社上得到的结果却大不相同。

sklearn.svm.LinearSVC: 81.05% in   28.87s train /    9.71s test
sklearn.svm.SVC      : 33.55% in 6536.53s train / 2418.62s test

两者都有一个线性内核。 LinearSVC 的容差高于 SVC 之一:

LinearSVC(C=1.0, tol=0.0001, max_iter=1000, penalty='l2', loss='squared_hinge', dual=True, multi_class='ovr', fit_intercept=True, intercept_scaling=1)
SVC      (C=1.0, tol=0.001,    max_iter=-1, shrinking=True, probability=False, cache_size=200, decision_function_shape=None)

否则这两个功能有何不同？ 即使我设置了 kernel='linear , tol=0.0001 , max_iter=1000 and Decision_function_shape='ovr' the SVC takes much longer than线性SVC`。为什么？

我用 sklearn 0.18并且两者都包裹在 OneVsRestClassifier 中.我不确定这是否与 multi_class='ovr' 相同/ decision_function_shape='ovr' .

最佳答案

真的，LinearSVC和 SVC(kernel='linear')产生不同的结果，i。 e.指标得分和决策边界，因为它们使用不同的方法。下面的玩具示例证明了这一点:

from sklearn.datasets import load_iris
from sklearn.svm import LinearSVC, SVC

X, y = load_iris(return_X_y=True)

clf_1 = LinearSVC().fit(X, y)  # possible to state loss='hinge'
clf_2 = SVC(kernel='linear').fit(X, y)

score_1 = clf_1.score(X, y)
score_2 = clf_2.score(X, y)

print('LinearSVC score %s' % score_1)
print('SVC score %s' % score_2)

--------------------------
>>>    0.96666666666666667
>>>    0.98666666666666669

这种差异的主要原则如下:

默认缩放，LinearSVC最小化平方铰链损失，而 SVC最小化常规铰链损失。可以为 loss 手动定义“铰链”字符串LinearSVC 中的参数.

LinearSVC使用 One-vs-All(也称为 One-vs-Rest)多类归约，而 SVC使用 One-vs-One多类减少。还注明 here .此外，对于多类分类问题 SVC适合 N * (N - 1) / 2型号在哪里N是类(class)的数量。 LinearSVC相比之下，简单地适合 N模型。如果分类问题是二元的，那么两种场景都只适合一个模型。 multi_class和 decision_function_shape参数没有共同点。第二个是聚合器，它将决策函数的结果转换为 (n_features, n_samples) 的方便形状。 . multi_class是一种建立解决方案的算法方法。

LinearSVC 的基础估计量是 liblinear ，这实际上会惩罚拦截。 SVC用途 libsvm 估计量没有。 liblinear 估计器针对线性(特殊)情况进行了优化，因此在大量数据上的收敛速度比 快libsvm .这就是为什么LinearSVC解决问题所需的时间更少。

事实上， LinearSVC正如评论部分所述，截距缩放后实际上并不是线性的。

关于scikit-learn - LinearSVC 和 SVC(内核 ="linear")有什么区别？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45384185/

24

4

0

文章推荐： rest - 如何在 Google Spreadsheet API v4 中指定 gid(标签)？

文章推荐： r - 使用 R 的 plotly 绘制带有树状图的聚类热图

python - LinearSVC 无法使用均值差进行分类
我有两组模式，其中有一个补丁，两个模式之间的平均值显着不同(由 t 检验给出 [值为 t-vals])。此处，第一组的平均值为 1±0.1，第二组的平均值为 2±0.1，平均差异约为 1。 b> 我正
python - 将训练数据添加到现有的 LinearSVC
我正在抓取大约 200,000 个网站，寻找小型企业网站上发布的某些类型的媒体。我有一个腌制的 LinearSVC，我已经训练它来预测网页上找到的链接包含我正在寻找的类型的媒体的概率，并且它的性能相当
Neuraxle 简单流水线故障(StandardScaler -> LinearSVC)
我不明白为什么这个神经轴管道不起作用。我只想要缩放数据并应用 LinearSVC。我做错了什么？这就是我想要做的: import numpy as np from sklearn.ensembl
scikit-learn - LinearSVC 变换的阈值如何工作？
我使用 LinearSVC 作为决策树分类器的预处理步骤。我运行 LinearSVC 然后我做变换(X)。我注意到特征数量从大约 35 个减少到 9 个。我想知道实际选择了哪些特征。我知道默认情况下
python - SKL学习如何获取 LinearSVC 分类器的决策概率
我正在使用 scikit-learn 的 LinearSVC 分类器进行文本挖掘。我将 y 值作为标签 0/1，将 X 值作为文本文档的 TfidfVectorizer。我使用如下所示的管道 pi
python - SKL学习如何获取 LinearSVC 分类器的决策概率
我正在使用 scikit-learn 的 LinearSVC 分类器进行文本挖掘。我将 y 值作为标签 0/1，将 X 值作为文本文档的 TfidfVectorizer。我使用如下所示的管道 pi
python - Sklearn LinearSVC 库中惩罚和损失参数的区别
我对 SVM 理论不是很熟悉，我在 python 中使用这个 LinearSVC 类: http://scikit-learn.org/stable/modules/generated/sklearn
python - 'LinearSVC' 对象没有属性 'classes_'
我有几个图像样本，我想预测这些图像是否包含文本/字符。当我尝试在这一步运行我的代码时出现错误: model = cPickle.load(f) is_text = model.predict(ima
python - 使用 LinearSVC 进行特征选择
当我尝试使用我的数据(来自 this example )运行以下代码时 X_new = LinearSVC(C=0.01, penalty="l1", dual=False).fit_transfor
python - 使用 scikit LinearSVC 的预测置信度
我正在使用 LinerSVC 技术对文本进行分类，但我想获得每个预测都附带的预测置信度。这是我现在拥有的: train_set = self.read_training_files()
python - LinearSVC 中参数 class_weight 的最佳值是多少？
我有一个多标签数据(有些类有 2 个标签，有些类有 10 个标签)，并且我的模型对于平衡值和无值过度拟合。为 class_weight 参数设置的最佳值是多少。 from sklearn.svm im
python - Scikit 的 LinearSVC 分类器的核外训练
您如何训练 Scikit 的 LinearSVC在太大或不切实际而无法放入内存的数据集上？我试图用它来对文档进行分类，并且我有几千条标记的示例记录，但是当我尝试将所有这些文本加载到内存中并训练 Lin
python - AttributeError :'LinearSVC' 对象没有属性 'predict_proba'
我正在尝试使用LinearSVC 分类器更新:添加了导入 import nltk from nltk.tokenize import word_tokenize from nltk.classify
python - PySpark ML : OnevsRest strategy for LinearSVC
我是 PySpark 的新手。我在 Windows 10 上安装了 Spark 2.3.0 。我想使用线性 SVM 分类器进行交叉验证训练，但用于具有 3 个类的数据集。所以我正在尝试应用 Spark
machine-learning - 什么时候应该使用 LinearSVC 或 SVC？
根据我的研究，我发现了三个相互矛盾的结果: SVC(kernel="linear") is better LinearSVC is better Doesn't matter 有人可以解释何时使用 L
python - 属性错误 : 'LinearSVC' object has no attribute 'classes_'
此代码用于检测字符和绘制矩形，然后预测字符，但每次都会给我以下错误! for rect in rects: # Draw the rectangles cv2.rectangle(im, (rect[
python - 从 sklearn.svm.LinearSVC 对象获取类标签
我们如何从分类器对象中获取类别标签(例如，['business','lifestyle','sports','tech'])？分类器方法 predict 能够生成标签，所以我猜它应该存储在分类器对象内
scikit-learn - sklearn : AUC score for LinearSVC and OneSVM
SVM 分类器 ( SVC ) 的一种选择是 probability默认情况下是假的。文档没有说明它的作用。看着 libsvm源代码，它似乎做了某种交叉验证。 LinearSVC 不存在此选项也不是
scikit-learn - LinearSVC.coef_ 中的 n_classes 顺序
我正在使用 LinearSVC 将文本数据分为 3 类。输入数据是每个单词的 tfidf 分数。我有兴趣看到单词对分类的“贡献”。第一个问题是我可以使用 coef_ 吗？该文件指出: coef_ :
scikit-learn - LinearSVC() 不同于 SVC(kernel ='linear')
当数据有偏移(不以零为中心)时，LinearSVC()和 SVC(kernel='linear')正在给出截然不同的结果。 (编辑:问题可能在于它不处理非规范化数据。) import matplotl

首页

博学

6Ren·AI

商城

scikit-learn - LinearSVC 和 SVC(内核 ="linear")有什么区别？