gpt4 book ai didi

c++ - 为什么这个 Rcpp 代码比字节编译的 R 慢?

转载 作者:塔克拉玛干 更新时间:2023-11-03 00:28:50 25 4
gpt4 key购买 nike

正如问题标题所说,我想知道为什么字节编译的 R 代码(使用 compiler::cmpfun)比以下数学函数的等效 Rcpp 代码更快:

func1 <- function(alpha, tau, rho, phi) {
abs((alpha + 1)^(tau) * phi - rho * (1- (1 + alpha)^(tau))/(1 - (1 + alpha)))
}

因为这是一个简单的数值运算,我原以为 Rcpp(funcCppfuncCpp2)比字节编译的 R(func1cfunc2c),特别是因为 R 会在存储 (1+alpha)**tau 时有更多开销或需要重新计算它。事实上,两次计算这个指数似乎比 R 中的内存分配更快(func1c vs func2c),这似乎特别违反直觉,因为 n 是大。我的另一个猜测是,也许 compiler::cmpfun 正在施展魔法,但我想知道情况是否确实如此。

真的,我想知道的两件事是:

  1. 为什么 funcCpp 和 funcCpp2 比 func1c 和 func2c 慢? (Rcpp 比编译后的 R 函数慢)

  2. 为什么 funcCpp 比 func2 慢? (Rcpp 代码比纯 R 慢)

FWIW,这是我的 C++ 和 R 版本数据

user% g++ --version
Configured with: --prefix=/Library/Developer/CommandLineTools/usr --with-gxx-include-dir=/usr/include/c++/4.2.1
Apple LLVM version 7.0.0 (clang-700.0.72)
Target: x86_64-apple-darwin14.3.0
Thread model: posix

user% R --version
R version 3.2.2 (2015-08-14) -- "Fire Safety"
Copyright (C) 2015 The R Foundation for Statistical Computing
Platform: x86_64-apple-darwin14.5.0 (64-bit)

这是 R 和 Rcpp 代码:

library(Rcpp)
library(rbenchmark)

func1 <- function(alpha, tau, rho, phi) {
abs((1 + alpha)^(tau) * phi - rho * (1- (1 + alpha)^(tau))/(1 - (1 + alpha)))
}

func2 <- function(alpha, tau, rho, phi) {
pval <- (alpha + 1)^(tau)
abs( pval * phi - rho * (1- pval)/(1 - (1 + alpha)))
}

func1c <- compiler::cmpfun(func1)
func2c <- compiler::cmpfun(func2)

func3c <- Rcpp::cppFunction('
double funcCpp(double alpha, int tau, double rho, double phi) {
double pow_val = std::exp(tau * std::log(alpha + 1.0));
double pAg = rho/alpha;
return std::abs(pow_val * (phi - pAg) + pAg);
}')

func4c <- Rcpp::cppFunction('
double funcCpp2(double alpha, int tau, double rho, double phi) {
double pow_val = pow(alpha + 1.0, tau) ;
double pAg = rho/alpha;
return std::abs(pow_val * (phi - pAg) + pAg);
}')

res <- benchmark(
func1(0.01, 200, 100, 1000000),
func1c(0.01, 200, 100, 1000000),
func2(0.01, 200, 100, 1000000),
func2c(0.01, 200, 100, 1000000),
func3c(0.01, 200, 100, 1000000),
func4c(0.01, 200, 100, 1000000),
funcCpp(0.01, 200, 100, 1000000),
funcCpp2(0.01, 200, 100, 1000000),
replications = 100000,
order='relative',
columns=c("test", "replications", "elapsed", "relative"))

这是 rbenchmark 的输出:

                             test replications elapsed relative
func1c(0.01, 200, 100, 1e+06) 100000 0.349 1.000
func2c(0.01, 200, 100, 1e+06) 100000 0.372 1.066
funcCpp2(0.01, 200, 100, 1e+06) 100000 0.483 1.384
func4c(0.01, 200, 100, 1e+06) 100000 0.509 1.458
func2(0.01, 200, 100, 1e+06) 100000 0.510 1.461
funcCpp(0.01, 200, 100, 1e+06) 100000 0.524 1.501
func3c(0.01, 200, 100, 1e+06) 100000 0.546 1.564
func1(0.01, 200, 100, 1e+06) 100000 0.549 1.573K

最佳答案

这本质上是一个不适定的问题。当你放置

func1 <- function(alpha, tau, rho, phi) {
abs((alpha + 1)^(tau) * phi - rho * (1- (1 + alpha)^(tau))/(1 - (1 + alpha)))
}

甚至不指定参数是什么(即标量? vector ?大?小?内存开销),那么在最好的情况下,您可能会直接从解析的表达式中获得一小组(基本的,高效的)函数调用。

自从我们有了字节编译器(Luke Tierney 在随后的 R 版本中对其进行了改进)以来,我们就知道它可以很好地处理代数表达式。

现在,编译后的 C/C++ 代码也能很好地做到这一点——但是调用编译后的 coed 会产生开销,您在这里看到的是,对于“足够简单”的问题,开销并没有真正得到摊销。

所以你最终几乎是平局。据我所知,这并不奇怪。

关于c++ - 为什么这个 Rcpp 代码比字节编译的 R 慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33159349/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com