r - foreach() 垃圾收集-6ren

r - foreach() 垃圾收集

转载作者：行者123 更新时间：2023-12-04 16:12:37

28

4

我正在使用 doSMP 包中的嵌套 foreach 根据我开发的函数生成结果。通常问题会使用三个嵌套循环，但由于生成的结果的大小(每个 i 大约 80,000)，当最终结果矩阵超过指定的行数时，我不得不暂停编译并将结果写入文件。

i = 1
write.off = 1

while(i <= length(i.vector)){
        results.frame = as.data.frame(matrix(NA, ncol = 3, nrow = 1))

        while(nrow(results.frame) < 500000 & i <= length(i.vector)){
                results = foreach(j = 1:length(j.vector), .combine = "rbind", .inorder = TRUE) %:%
                foreach(k = 1:length(k.vector), .combine = "rbind", .inorder = TRUE) %dopar%{

                        ith.value = i.vector[i]
                        jth.value = j.vector[j]
                        kth.value = k.vector[k]
                        my.function(ith.value, jth.value, kth.value)
                }

                results.frame = rbind(results.frame, results)
                i = i + 1
        }

        results.frame = results.frame[-1,]
        write.table(results.frame, paste("part_",write.off, sep = ""))
        write.off = write.off + 1   
}

我遇到的问题是垃圾收集。工作人员似乎没有将内存重新分配回系统，因此在 i = 4 时，他们每个人都吃掉了大约 6GB 的内存。

我已经尝试将 gc() 直接插入到 foreach 循环以及底层函数中，并且我还尝试将函数及其结果分配给我可以定期清除的命名环境。这些方法都没有奏效。

我觉得 foreach 的 initEnvir 和 finalEnvir 参数可能会提供一个解决方案，但文档和示例并没有真正说明这一点。

我在运行 Windows Server 2008 的 VM 上运行此代码。

最佳答案

您可以考虑通过编写不同的循环来完全避免这个问题。

考虑使用 gen.factorial函数在 AlgDesign ，啦啦:

fact1 = gen.factorial(c(length(i.vector), length(j.vector), length(k.vector)), nVars = 3, center = FALSE)
foreach(ix_row = 1:nrow(fact1)) %dopar% {
  my.function(fact1[ix_row,])
}

您还可以使用内存映射文件并使用 bigmemory 预先分配输出存储。 (假设您正在创建一个矩阵)，这将使每个工作人员可以自行存储其输出。

这样，您的整体内存使用量应该会大幅下降。

更新 1:似乎内存问题是 doSMP 的特有问题。 .查看以下帖子:

Answer by Revo engineer discusses some memory & process issues

Joris Meys reports that doSMP crashes his R instances frequently

我记得看到另一个内存问题 doSMP ，无论是作为问题还是在 R 聊天中，但我似乎无法恢复帖子。

更新 2:我不知道这是否会有所帮助，但您可以尝试使用显式 return() (例如 return(my.function(ith.value, jth.value, kth.value)) )。在我的代码中，我通常使用显式 return()为了清楚起见。

关于r - foreach() 垃圾收集，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7996607/

28

4

0

文章推荐： d3.js - 同一页面上的两个圆环图

文章推荐： chart.js - 如何在 Angular 5 中创建堆叠圆环图

文章推荐： ruby-on-rails - ActionMailer - 限制收件人数量？

文章推荐： sql - 一次运行 1000 个查询的大量更新查询的最佳方法

php foreach 中的 foreach 中的 foreach
这是一个假设性问题。如果我有来自 3 个单独的 sql db 查询的 3 个数组，这些查询都与另一个数组相关。例如…… //db schools id | school_name classes id
c# - foreach 里面 foreach 里面 foreach
在我的应用程序中，我使用 scrape(string url) 方法从网页中抓取链接。可以说它每次都返回我 10 个 url。我想从每个抓取的 url 中抓取 10 个链接。长话短说: (第 1
java - 迁移java 7到java 8 - forEach in forEach in forEach 并导致HashMap？
我的java7代码: final Map result = new HashMap<>(); final Set> classes = getClasses(co.glue()); for (fina
foreach - 如何在例如分配变量SwiftUI 中的 ForEach？
是否可以在 SwiftUI 中设置变量，例如在这样的 ForEach 中: struct ContentView: View { var test: Int var body: som
foreach - 首选 foreach 索引类型
在 D、int、uint 中使用 foreach 时，循环索引的首选类型是什么？或者只是通过省略类型自动实现？最佳答案一般来说，索引应该是size_t。与长度相同。如果您尝试使用 int 或 ui
foreach - DMD 不强制限制 foreach
根据 http://dlang.org/statement.html 的“Foreach 限制”部分以下代码 int[] a; int[] b; foreach (int i; a) { a
foreach - 新旧 foreach 循环
在什么情况下我们应该在 JDK 8 中使用旧的 foreach 循环遍历新的 collection.forEach() 还是最好的做法是转换 every foreach 循环？是否存在任何重要的性能差
foreach - 嵌套递增 foreach 循环
获得类似东西的惯用方法是什么？ ((fn [coll] (function-body)) [:a :b :c :d]) -> [[:a :b][:a :c][:a :d][:b :c][:b :d][
java - Foreach in foreach 从列表中删除项目
我正在创建一个基于 who is it? 的 Java 应用程序。现在我正在制作一种方法，在回答问题时我需要其他卡片。我有两个列表: 列表是一个 ImageView 列表，其中我有卡片必须代表的 2
php - foreach 行插入 foreach
我希望有人能在我发疯之前帮助我。我有 3 张 table : Table A SELECT companypk, companyname, logo, msscope FROM global_com
c# - ForEach 和 foreach
我正在尝试将多个字符串添加到 C# 中的 MailAddress。如果我使用ForEach，我的代码会是这样 foreach (var item in GetPeopleList()
foreach 循环中的 C# foreach
我没有太多的 C# 经验，所以如果有人能指出正确的方向，我将不胜感激。我有一个引用对象变量的 foreach 循环。我希望在主循环中创建另一个 foreach 循环，将当前变量与对象数组中的其余变量进
foreach - 为 foreach() 提供的参数无效
下面的代码每 60 秒删除文件夹“Images”中的文件，它可以工作，但是当文件夹为空时它会显示:警告:为 foreach() 提供的参数无效如果没有文件，如何解决这个问题，说“文件夹为空而不是那个警
PHP SQL 多表分层 foreach 内的 foreach 内的 foreach 仅具有以上 1 级的引用
我需要在两种不同的模式下运行，因此“if”(第二个稍后构建一个大的 csv) 下面对于单个实例运行正常，但在第二个 (*) 的加载时间上失败，因为在前 7k 行中的每一行上运行。我想避免可怕的事情
javascript - 使用 forEach、[].forEach.call(...) 或 Array.prototype.slice.call(...).forEach 迭代类似数组的对象？
我们可以使用以下两种方法实现类数组对象的迭代: let arrayLike = document.getElementsByClassName('dummy'); [].forEach.call(ar
foreach - 根据 TLD，forEach 标签的属性值无效
我有这个代码 ... 它说: Attribute value invalid for tag forEach according to TLD 最佳答案 forEach标签不支持 valu
foreach - 如何获取 SwiftUI ForEach 中的前一个元素？
我在 SwiftUI 中有一个像这样的 ForEach: ForEach(entries) { (e: MyType) in NavigationLinkItem(entry: e) } 现在我
Powershell Foreach-Object Foreach 循环从多个文件读取字符串并写入一个
我无法在一个 Foreach 或 Foreach-Object 循环中使用多个命令我的情况是—— 我有很多文本文件，大约 100 个。所以他们被阅读 Get-ChildItem $FilePath
javascript - 在另一个 ForEach 中创建一个 forEach
我必须从 json 文件(实际上是 2 个 json 文件)执行 ForEach，因此我执行 2 forEach，代码是 table { font-family: arial, sans-
javascript - 如何修复 foreach forEach 不是函数
我对编程很陌生，当我执行 forEach 函数时，我的应用程序返回错误。我的controller.js中有以下代码 $scope.ajaxRequest = A.Game.get({action: '

首页

博学

6Ren·AI

商城

r - foreach() 垃圾收集