gpt4 book ai didi

r - 机器学习功能通过在多个核心之间分配工作来处理大量数据

转载 作者:行者123 更新时间:2023-11-30 09:12:15 25 4
gpt4 key购买 nike

我正在尝试使用 r 在一些大数据(不是大数据)上运行一些机器学习算法。

我用来测试代码的(相对较小的)玩具数据只有不到 100,000 行和 850 列(包括 1 个具有 14 个级别的因子列)

我正在尝试运行一个 svm(包:e1071)、一棵树(包:tree)、一个随机森林(包:randomForest) code>)和提升树(包:gbm)。

我使用的计算机有 12 核。当我打开事件监视器时,这些功能似乎随机使用核心(一次最多 4 个)。 是否有一种功能可以在所有核心之间更有效地分配工作?

最佳答案

caret 包可以完成所有这些任务,同时允许您使用多核选项。

library(doMC) 
registerDoMC(cores = 5)
#All subsequent models are then run in parallel
model <- train(y ~ ., data = training, method = "rf")

这是 http://topepo.github.io/caret/parallel.html 中的一个示例

关于r - 机器学习功能通过在多个核心之间分配工作来处理大量数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31615036/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com