gpt4 book ai didi

python - 如何在 scikit learn 中为 SVC 估计器选择超参数?

转载 作者:行者123 更新时间:2023-11-30 09:37:56 27 4
gpt4 key购买 nike

我正在使用 SVC 对一些文本进行分类,并且我想运行网格搜索,因此我按照 documentation 中提供的示例进行操作。 。在示例中,他们使用带有以下参数的 SGDClassifier:

parameters = {
'vect__max_df': (0.5, 0.75, 1.0),
#'vect__max_features': (None, 5000, 10000, 50000),
'vect__ngram_range': ((1, 1), (1, 2)), # unigrams or bigrams
#'tfidf__use_idf': (True, False),
#'tfidf__norm': ('l1', 'l2'),
'clf__alpha': (0.00001, 0.000001),
'clf__penalty': ('l2', 'elasticnet'),
#'clf__n_iter': (10, 50, 80),
}

我的问题是,我应该为 SVC 分类器、tfidf、哈希向量化器和 CountVectorizer 尝试什么样的参数?如果这是一个多类分类问题,我应该如何选择这个参数?

最佳答案

您应该阅读这些参数的含义并自行决定。

我优化了以下内容:SVC: Gamma 和CTFIDF:max_features、max_df、min_df

这实际上取决于您的数据和模型。如果您不知道,请对许多参数和许多可能的值进行非常广泛的优化以缩小范围。这非常耗时,因此您可能需要对数据进行二次采样。

关于python - 如何在 scikit learn 中为 SVC 估计器选择超参数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27978507/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com