gpt4 book ai didi

r - 并行化采用外部指针的函数 (XPtr)

转载 作者:行者123 更新时间:2023-12-03 14:41:57 29 4
gpt4 key购买 nike

这个问题既不是this one 的重复问题也不属于 this one ,这是关于返回外部指针的函数。

问题来了。下面的 Rcpp 代码定义了两个函数,一个创建 XPtr,另一个可以在 XPtr 上工作。

#include <Rcpp.h>
using namespace Rcpp;

//[[Rcpp::export]]
SEXP f(int n) {
std::vector<int> * v = new std::vector<int>;

for(int i = 0; i < n; i++)
v->push_back(i);

XPtr< std::vector<int> > p(v, true);
return p;
}

//[[Rcpp::export]]
int g(XPtr< std::vector<int> > p, int i) {
return (*p)[i];

而且效果很好:

> x <- f(100)
> g(x, 45)
[1] 45

让我们尝试并行调用 g。这有效:

require(parallel)
test1 <- function(a) {
cl <- makeForkCluster(nnodes=2)
r <- parLapply(cl, 1:5, function(i) g(a,i) )
stopCluster(cl)
return(r)
}

预期行为:

> unlist( test1(x) )
[1] 1 2 3 4 5

但这行不通:

test2 <- function(a) {
cl <- makeForkCluster(nnodes=2)

p <- g(a, 0)
r <- parLapply(cl, 1:5, function(i) g(a,i) )
stopCluster(cl)
return(r)
}

意外行为:

> test2(x)
Error in checkForRemoteErrors(val) :
2 nodes produced errors; first error: external pointer is not valid

这个问题似乎是因为外部指针在调用集群中的从属之前在函数中使用了一次。如何解释此行为,是否有解决方法?非常感谢。

最佳答案

在函数的开头,a 是一个 promise ,即表示在特定环境中计算特定表达式的内容。当您访问变量时,会计算表达式,所以现在 a 是一个指针,并且该指针特定于特定的 R 实例。您可以使用 pryr::promise_info 来查看:

test2 <- function(a) {
cl <- makeForkCluster(nnodes = 2)
print(pryr::promise_info(a))
p <- g(a, 0)
print(pryr::promise_info(a))
stopCluster(cl)
return(r)
}

输出:

$code
x

$env
<environment: R_GlobalEnv>

$evaled
[1] FALSE

$value
NULL

$code
x

$env
NULL

$evaled
[1] TRUE

$value
<pointer: 0x565295e3a410>

一种解决方法是使用 eval(substitute(a)):

test2 <- function(a) {
cl <- makeForkCluster(nnodes = 2)
print(pryr::promise_info(a))
p <- g(eval(substitute(a)), 0)
print(pryr::promise_info(a))
r <- parLapply(cl, 1:5, function(i) g(a,i) )
stopCluster(cl)
return(r)
}

我确信有更好的方法。非标准评价对我来说还是有点陌生​​......

关于r - 并行化采用外部指针的函数 (XPtr),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54535966/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com