gpt4 book ai didi

python - sci-kit learn 中 SVC 概率输出的网格搜索交叉验证

转载 作者:行者123 更新时间:2023-11-30 09:27:37 24 4
gpt4 key购买 nike

我想对 SVC 分类器的概率输出运行网格搜索交叉验证。我特别想最小化负对数可能性。从文档来看, GridSearchCV 似乎调用了它所传递的估计器的 predict() 方法以及 predict() 方法SVC 返回类预测而不是概率(predict_proba() 返回类概率)。

1) 我是否需要对 SVC 进行子类化并为其提供返回概率而不是类的 predict() 方法来完成对数似然交叉验证?我想我需要编写自己的 score_funcloss_func

2)这种负对数似然的交叉验证是愚蠢的吗?我这样做是因为数据集是:a)不平衡的 5:1 和 b)根本不可分离,即即使是“最差”的观察结果也有 > 50% 的机会属于“好”类别。 (可能还会在统计问答中发布第二个问题)

最佳答案

  1. 是的,您会在两个帐户上都这样做。

    class ProbSVC(SVC):
    def predict(self, X):
    return super(ProbSVC, self).predict_proba(X)
  2. 我不确定这是否有效,因为多数类别可能仍主导对数似然分数,并且最终估计器仍可能为少数类别的样本产生 >.5 的正值。不过,我不确定,所以请将其发布到统计信息中。

关于python - sci-kit learn 中 SVC 概率输出的网格搜索交叉验证,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16668951/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com