r - 带有 doSMP 和 foreach 的并行随机森林大大增加了内存使用量(在 Windows 上)-6ren

r - 带有 doSMP 和 foreach 的并行随机森林大大增加了内存使用量(在 Windows 上)

转载作者：IT王子更新时间：2023-10-28 23:38:10

29

4

在串行执行随机森林时，它在我的系统上使用 8GB 的 RAM，而在并行执行时，它使用超过两倍的 RAM (18GB)。并行执行时如何将其保持在 8GB？代码如下:

install.packages('foreach')
install.packages('doSMP')
install.packages('randomForest')

library('foreach')
library('doSMP')
library('randomForest')

NbrOfCores <- 8 
workers <- startWorkers(NbrOfCores) # number of cores
registerDoSMP(workers)
getDoParName() # check name of parallel backend
getDoParVersion() # check version of parallel backend
getDoParWorkers() # check number of workers


#creating data and setting options for random forests
#if your run this please adapt it so it won't crash your system! This amount of data  uses up to 18GB of RAM.
x <- matrix(runif(500000), 100000)
y <- gl(2, 50000)
#options
set.seed(1)
ntree=1000
ntree2 <- ntree/NbrOfCores


gc()

#running serialized version of random forests

system.time(
rf1 <- randomForest(x, y, ntree = ntree))


gc()


#running parallel version of random forests

system.time(
rf2 <- foreach(ntree = rep(ntree2, 8), .combine = combine, .packages = "randomForest") %dopar% randomForest(x, y, ntree = ntree))

最佳答案

首先，SMP 将复制输入，以便每个进程都有自己的副本。这可以通过使用 multicore 进行转义，但还有另一个问题 - randomForest 的每次调用也会生成输入的内部副本。

您可以通过使 randomForest 删除森林模型本身(使用 keep.forest=FALSE)并在训练的同时进行测试(通过使用 xtest 和可能的 ytest 参数)。

关于r - 带有 doSMP 和 foreach 的并行随机森林大大增加了内存使用量(在 Windows 上)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8776816/

29

4

0

文章推荐： memory - 限制 ImageMagick 内存使用

文章推荐： android - 如何检查 SharedPreferences 文件是否存在

文章推荐： android - Eclipse 卡住访问项目 -> 属性 -> android 选项卡

c# - 随机 RAM 使用量
我希望有人能解释为什么我的应用程序在加载时使用不同数量的 RAM。我说的是直接使用 exe 的编译版本。这是一个非常基本的应用程序，在应用程序的启动中没有条件分支。然而，每次我启动它时，RAM 量都在
linux - 如何释放 Inode 使用量？
我有一个 inode 使用率为 100% 的磁盘驱动器(使用 df -i 命令)。但是在大量删除文件后，使用率仍然是 100%。那么正确的做法是什么？磁盘空间使用量较少的磁盘驱动器怎么可能有Ino
ethereum - 使用 if 语句时如何计算 gas 使用量
假设我与分支有一个智能合约，其中每个分支都有不同数量的操作。 if (someCondition) { // do operations costing 10 gas } else { //d
nearprotocol - 您如何估算 NEAR 智能合约方法调用的 gas 使用量？
是否有一种工具可以在提交到 NEAR 网络之前估算合约调用将产生多少 gas？最佳答案目前最好的估计是用runtime-standalone ，它可以处理交易而不必担心共识/网络。这意味着您可以创
caching - CacheServiceEmulator.exe > 3GB RAM 使用量？
我正在使用最新的 SDK 开发适用于 Windows Azure 的应用程序。目前我正在使用缓存实现 session 提供程序，但模拟器完全不成比例: 缓存被实现为“非常小的”辅助角色(最大 768
elasticsearch - 如何减少 Logstash 的 RAM 使用量？
我正在为我的 Logstash RAM 问题寻找答案，因为它几乎是 100%。我为它做了很多搜索，但他们没有为我工作。下面的代码是我的 logstash.conf 文件。我认为它需要一些小改动。 Lo
java - 我已经尝试了所有方法，但我无法限制最大 Java RAM 使用量
我已经阅读了这里有关此问题的所有其他问题以及互联网其他地方的许多文章。根据this site ，最大内存使用量遵循以下公式: Max memory = [-Xmx] + [-XX:MaxPermSiz
java - 如何在 Android 中以编程方式增加 RAM 使用量？
我需要以编程方式增加 Android 中的 RAM 使用量，以观察它随时间的变化。我该怎么做？我尝试生成很多自定义对象，但生成后意外地 RAM 使用量减少了...我更改了对象数量、结构等，但没有任何
docker - 如何限制 docker 容器内的 ArangoDB RAM 使用量？
我们使用带有 MMFiles 存储引擎的 ArangoDB 3.3.14(社区版)来处理相对较大的数据集(备份时会超过 30 GB)。我们使用 ECS 在 Docker 容器内运行它。我们的主机虚拟机
mysql - 在为 WordPress 站点排序此索引时，如何减少 MYSQL 使用量？
我收到了 Hostgator 发来的一条说明，表明他们限制了我对 MYSQL 的访问，因为我的网站使用了太多资源。通常，在这种情况下，我只会恢复备份以查看最近的更改是否会产生错误。但是，除了写了一些
delphi - 如何减少使用 Synapse TMimeMess 解码 MIME 时的巨大 RAM 使用量？
我使用 TMimeMess 来解码基于 SMTP 服务器的传入电子邮件在突触上。我发现用于解码 50MB MIME 消息(带有附件)，TMimeMess 使用了 600-800MB 的内存。在这里
android - 如何减少包含 1,000 个资源的 AIR Flash 应用程序中的内存 (RAM) 使用量？
我正在打包适用于 iOS 和 Android 的 Adobe Air 应用程序，并且我的 (RAM) 内存使用量超过 100MB。我的游戏(RPG)中有大量 Assets 。 Assets 的数量

首页

博学

6Ren·AI

商城

r - 带有 doSMP 和 foreach 的并行随机森林大大增加了内存使用量(在 Windows 上)