gpt4 book ai didi

machine-learning - 使用 sklearn 并行训练多个模型?

转载 作者:行者123 更新时间:2023-11-30 08:26:04 25 4
gpt4 key购买 nike

我想训练具有不同随机状态的多个 LinearSVC 模型,但我更喜欢并行进行。 sklearn 中有支持这一点的机制吗?我知道 Gridsearch 或某些集成方法正在隐式执行,但幕后的内容是什么?

最佳答案

引擎盖下的“东西”是图书馆 joblib ,它为 GridSearchCV 中的多重处理和一些集成方法提供了支持。它的Parallel辅助类是一把非常方便的瑞士刀,用于处理令人尴尬的并行 for 循环。

这是一个使用 joblib 与 4 个进程并行训练具有不同随机状态的多个 LinearSVC 模型的示例:

from joblib import Parallel, delayed
from sklearn.svm import LinearSVC
import numpy as np

def train_model(X, y, seed):
model = LinearSVC(random_state=seed)
return model.fit(X, y)

X = np.array([[1,2,3],[4,5,6]])
y = np.array([0, 1])
result = Parallel(n_jobs=4)(delayed(train_model)(X, y, seed) for seed in range(10))
# result is a list of 10 models trained using different seeds

关于machine-learning - 使用 sklearn 并行训练多个模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29589327/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com