gpt4 book ai didi

r - 在 missForest 包中并行化进程

转载 作者:行者123 更新时间:2023-12-04 00:43:07 36 4
gpt4 key购买 nike

我正在使用一个名为 missForest 的包来估计我的数据集中的缺失值。我的问题是:我们如何并行执行此过程以缩短获得结果所需的时间?请引用这个例子(来自 missForest 包):

 data(iris)
summary(iris)

数据包含四个连续变量和一个分类变量。使用 prodNA 函数人工生成缺失值:

set.seed(81)
iris.mis <- prodNA(iris, noNA = 0.2)
summary(iris.mis)

估算缺失值,提供完整矩阵以供说明。使用“详细”查看迭代之间发生的情况:

iris.imp <- missForest(iris.mis, xtrue = iris, verbose = TRUE)

最佳答案

昨天我向CRAN提交了missForest的1.4版本; Windows 和 Linux 软件包已准备就绪,Mac 版本即将推出。

新函数有一个额外的参数“parallelize”,它允许以并行方式计算单个森林(parallelize="forests")或同时计算多个变量的多个森林(parallelize="variables").默认设置是没有并行计算(parallelize="no")。

不要忘记注册一个合适的并行后端,例如在第一次尝试之前使用包“doParallel”。 “doParallel”小插图在第 4 节中给出了一个说明性示例。

由于一些其他细节,我不得不暂时从包中删除“missForest”小插图。但我会在适当的时候解决这个问题并将其作为 1.4-1 版本发布。

关于r - 在 missForest 包中并行化进程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16719962/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com