gpt4 book ai didi

python - 如何在sklearn中为svm选择参数

转载 作者:行者123 更新时间:2023-11-30 09:19:43 25 4
gpt4 key购买 nike

我正在尝试使用 sklearn 中的 SVM 来解决分类问题。我得到了一个高度稀疏的数据集,包含超过 50K 行和二进制输出。
问题是我不太清楚如何有效地选择参数,主要是内核、gamma 和 C。

例如,对于内核,我是否应该尝试所有内核并只保留给我最满意结果的内核,或者在选择内核之前我们可以首先看到与我们的数据相关的内容?< br/>C 和 gamma 也是如此。

谢谢!

最佳答案

是的,这主要是一个实验问题 - 特别是您对您的数据集知之甚少:可分离性、线性、密度、连通性……所有影响分类算法的特征。

首先尝试线性和高斯内核。如果线性不能很好地工作而高斯可以,那么尝试其他内核。

一旦找到最好的 1 或 2 个内核,然后就可以使用成本和 Gamma 参数。 Gamma 是一个“松弛”参数:它允许内核做出一定比例的原始分类错误,作为其他好处的权衡:间隙宽度、划分函数的简单性等。

我还没有一个应用程序能够通过改变成本获得比微不足道的好处。

关于python - 如何在sklearn中为svm选择参数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44441002/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com