gpt4 book ai didi

parallel-processing - 具有并行作业的 RFECV

转载 作者:行者123 更新时间:2023-12-04 19:43:09 24 4
gpt4 key购买 nike

我想使用包含的交叉验证 (RFECV) 执行递归特征消除。我的问题是,虽然我对我的数据进行了大量二次采样,但由于我的特征数量 (278),这个过程太慢了,而且可能无法在我为实验分配的时间内得出结论。

我已经看到 scikit-learn 中的典型交叉验证通过定义可以并行运行的作业数量来支持并行化。 RFECV 中的任务是否可以并行化?

最佳答案

changelog for the version 0.18 release显示 RFECV 现在支持 n_jobs

按照 RFECV documentation 中的示例(我将 n_samples50 更改为 5000)

from sklearn.datasets import make_friedman1
from sklearn.feature_selection import RFECV
from sklearn.svm import SVR

X, y = make_friedman1(n_samples=5000, n_features=5, random_state=0)
estimator = SVR(kernel="linear")

1 个作业:22.5 秒

%%time
selector = RFECV(estimator, step=1, cv=5, n_jobs=1)
selector = selector.fit(X, y)

CPU times: user 23.1 s, sys: 2.71 s, total: 25.8 s
Wall time: 22.5 s

4 个作业:11.8 秒

%%time
selector = RFECV(estimator, step=1, cv=5, n_jobs=4)
selector = selector.fit(X, y)

CPU times: user 3.42 s, sys: 312 ms, total: 3.74 s
Wall time: 11.8 s

关于parallel-processing - 具有并行作业的 RFECV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38313512/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com