gpt4 book ai didi

python - Sklearn 如何使用 Joblib 或 Pickle 保存从管道和 GridSearchCV 创建的模型?

转载 作者:IT老高 更新时间:2023-10-28 22:19:00 25 4
gpt4 key购买 nike

在使用 pipelineGridSearchCV 确定最佳参数后,我如何 pickle/joblib 这个过程以后再用?当它是一个单一的分类器时,我知道如何做到这一点......

from sklearn.externals import joblib
joblib.dump(clf, 'filename.pkl')

但是在执行和完成 gridsearch 之后,如何使用最佳参数保存整个 pipeline

我试过了:

  • joblib.dump(grid, 'output.pkl') - 但这会转储每个 gridsearch尝试(许多文件)
  • joblib.dump(pipeline, 'output.pkl') - 但我不要认为它包含最好的参数

X_train = df['Keyword']
y_train = df['Ad Group']

pipeline = Pipeline([
('tfidf', TfidfVectorizer()),
('sgd', SGDClassifier())
])

parameters = {'tfidf__ngram_range': [(1, 1), (1, 2)],
'tfidf__use_idf': (True, False),
'tfidf__max_df': [0.25, 0.5, 0.75, 1.0],
'tfidf__max_features': [10, 50, 100, 250, 500, 1000, None],
'tfidf__stop_words': ('english', None),
'tfidf__smooth_idf': (True, False),
'tfidf__norm': ('l1', 'l2', None),
}

grid = GridSearchCV(pipeline, parameters, cv=2, verbose=1)
grid.fit(X_train, y_train)

#These were the best combination of tuning parameters discovered
##best_params = {'tfidf__max_features': None, 'tfidf__use_idf': False,
## 'tfidf__smooth_idf': False, 'tfidf__ngram_range': (1, 2),
## 'tfidf__max_df': 1.0, 'tfidf__stop_words': 'english',
## 'tfidf__norm': 'l2'}

最佳答案

import joblib
joblib.dump(grid.best_estimator_, 'filename.pkl')

如果您想将对象转储到一个文件中 - 使用:

joblib.dump(grid.best_estimator_, 'filename.pkl', compress = 1)

关于python - Sklearn 如何使用 Joblib 或 Pickle 保存从管道和 GridSearchCV 创建的模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34143829/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com