mvtnorm::pmvnorm 的 Rcpp 实现比原始 R 函数慢-6ren

mvtnorm::pmvnorm 的 Rcpp 实现比原始 R 函数慢

转载作者：行者123 更新时间：2023-12-02 17:07:02

25

4

我正在尝试让 Rcpp 版本的 pmvnorm 至少与 R 中的 mvtnorm::pmvnorm 一样快。

我找到了 https://github.com/zhanxw/libMvtnorm并使用相关源文件创建了一个 Rcpp 框架包。我添加了以下使用 Armadillo 的函数(因为我在编写的其他代码中使用了它)。

//[[Rcpp::export]]
arma::vec triangl(const arma::mat& X){
  arma::mat LL = arma::trimatl(X, -1);  // omit the main diagonal
  return LL.elem(arma::find(LL != 0));
}

//[[Rcpp::export]]
double pmvnorm_cpp(arma::vec& bound, arma::vec& lowtrivec){
  double error;
  int n = bound.n_elem;
  double* boundptr = bound.memptr();
  double* lowtrivecptr = lowtrivec.memptr();
  double result = pmvnorm_P(n, boundptr, lowtrivecptr, &error);
  return result;
}

从构建包后的 R 中，这是一个可重现的示例:

set.seed(1)
covar <- rWishart(1, 10, diag(5))[,,1]
sds <- diag(covar) ^-.5
corrmat <- diag(sds) %*% covar %*% diag(sds)
triang <- triangl(corrmat)

bounds <- c(0.5, 0.9, 1, 4, -1)

rbenchmark::benchmark(pmvnorm_cpp(bounds, triang),
                      mvtnorm::pmvnorm(upper=bounds, corr = corrmat),
                      replications=1000)

这表明 pmvnorm_cpp 比 mvtnorm::pmvnorm 慢得多。结果是不同的。

> pmvnorm_cpp(bounds, triang)
[1] 0.04300643
> mvtnorm::pmvnorm(upper=bounds, corr = corrmat)
[1] 0.04895361

这让我感到困惑，因为我认为基本的 Fortran 代码是相同的。我的代码中有什么东西让一切变慢了吗？或者我应该尝试直接移植 mvtnorm::pmvnorm 代码吗？我几乎没有使用 Fortran 的经验。

感谢建议，请原谅我的无能。

编辑:为了与替代品进行快速比较，这个:

//[[Rcpp::export]]
NumericVector pmvnorm_cpp(NumericVector bound, NumericMatrix cormat){
  Environment stats("package:mvtnorm"); 
  Function f = stats["pmvnorm"];

  NumericVector lower(bound.length(), R_NegInf);
  NumericVector mean(bound.length());
  NumericVector res = f(lower, bound, mean, cormat);
  return res;
}

具有与 R 调用基本相同的性能(以下是 40 维 mvnormal):

> rbenchmark::benchmark(pmvnorm_cpp(bounds, corrmat),
+                       mvtnorm::pmvnorm(upper=bounds, corr = corrmat),
+                       replications=100)
                                              test replications elapsed relative user.self sys.self
2 mvtnorm::pmvnorm(upper = bounds, corr = corrmat)          100   16.86    1.032     16.60     0.00
1                     pmvnorm_cpp(bounds, corrmat)          100   16.34    1.000     16.26     0.01

所以在我看来，前面的代码中一定有什么事情发生了。无论是我如何处理 Armadillo 的事情，还是其他事情之间的联系。我认为与上一个实现相比应该有性能提升。

最佳答案

我不会为此尝试使用额外的库，而是尝试使用 mvtnorm 导出的 C API，c.f. https://github.com/cran/mvtnorm/blob/master/inst/NEWS#L44-L48 .在这样做的同时，我发现了导致结果不同的三个原因。其中之一还对性能差异负责:

mvtnorm 使用 R 的 RNG，而这已从您正在使用的库中删除，c.f. https://github.com/zhanxw/libMvtnorm/blob/master/libMvtnorm/randomF77.c .
您的 triangl 函数不正确。它以列优先顺序返回下三角矩阵。然而，底层的 Fortran 代码期望它按行优先顺序排列，c.f. https://github.com/cran/mvtnorm/blob/master/src/mvt.f#L36-L39和 https://github.com/zhanxw/libMvtnorm/blob/master/libMvtnorm/mvtnorm.cpp#L60
libMvtnorm 使用 1e-6 而不是 1e-3 作为相对精度，c.f. https://github.com/zhanxw/libMvtnorm/blob/master/libMvtnorm/mvtnorm.cpp#L65 .这也是造成性能差异的原因。

我们可以使用以下代码进行测试:

// [[Rcpp::depends(RcppArmadillo)]]
#include <RcppArmadillo.h>
// [[Rcpp::depends(mvtnorm)]]
#include <mvtnormAPI.h>

//[[Rcpp::export]]
arma::vec triangl(const arma::mat& X){
  int n = X.n_cols;
  arma::vec res(n * (n-1) / 2);
  for (int i = 0; i < n; ++i) {
    for (int j = 0; j < i; ++j) {
      res(j + i * (i-1) / 2) = X(i, j);
    }
  }
  return res;
}

// [[Rcpp::export]]
double pmvnorm_cpp(arma::vec& bound,
           arma::vec& lowertrivec,
           double abseps = 1e-3){

  int n = bound.n_elem;
  int nu = 0;
  int maxpts = 25000;     // default in mvtnorm: 25000
  double releps = 0;      // default in mvtnorm: 0
  int rnd = 1;            // Get/PutRNGstate

  double* bound_ = bound.memptr();
  double* correlationMatrix = lowertrivec.memptr();
  double* lower = new double[n];
  int* infin = new int[n];
  double* delta = new double[n];

  for (int i = 0; i < n; ++i) {
    infin[i] = 0; // (-inf, bound]
    lower[i] = 0.0;
    delta[i] = 0.0;
  }

  // return values
  double error;
  double value;
  int inform;

  mvtnorm_C_mvtdst(&n, &nu, lower, bound_,
           infin, correlationMatrix, delta,
           &maxpts, &abseps, &releps,
           &error, &value, &inform, &rnd);
  delete[] (lower);
  delete[] (infin);
  delete[] (delta);

  return value;
}

/*** R
set.seed(1)
covar <- rWishart(1, 10, diag(5))[,,1]
sds <- diag(covar) ^-.5
corrmat <- diag(sds) %*% covar %*% diag(sds)
triang <- triangl(corrmat)
bounds <- c(0.5, 0.9, 1, 4, -1)
set.seed(1)
system.time(cat(mvtnorm::pmvnorm(upper=bounds, corr = corrmat), "\n"))
set.seed(1)
system.time(cat(pmvnorm_cpp(bounds, triang, 1e-6), "\n"))
set.seed(1)
system.time(cat(pmvnorm_cpp(bounds, triang, 0.001), "\n"))
 */

结果:

> system.time(cat(mvtnorm::pmvnorm(upper=bounds, corr = corrmat), "\n"))
0.04896221 
   user  system elapsed 
  0.000   0.003   0.003 

> system.time(cat(pmvnorm_cpp(bounds, triang, 1e-6), "\n"))
0.04895756 
   user  system elapsed 
  0.035   0.000   0.035 

> system.time(cat(pmvnorm_cpp(bounds, triang, 0.001), "\n"))
0.04896221 
   user  system elapsed 
  0.004   0.000   0.004

在相同的 RNG(和 RNG 状态)、正确的下三角相关矩阵和相同的相对精度下，结果相同且性能相当。精度越高，性能就越差。

所有这些都是针对使用 Rcpp::sourceCpp 的独立文件。为了在包中使用它，您需要将 LinkingTo: mvtnorm 添加到您的 DESCRIPTION 文件。

关于mvtnorm::pmvnorm 的 Rcpp 实现比原始 R 函数慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51290014/

25

4

0

文章推荐： r - 使用 R 中的 Grepl 查找数据框列中存在的单词列表

文章推荐： python - 无法在 scrapy 脚本中禁用日志消息

文章推荐： boto3 - Airflow 中的 S3Hook : no attribute 'get_credentials'

文章推荐： push-notification - Twilio Chat IOS 生产 APN 认证错误 52131

java - 原始 + ""与 Wrapper.toString(原始)
当需要将原始类型转换为字符串时，例如传递给需要字符串的方法时，基本上有两种选择。以int为例，给出: int i; 我们可以执行以下操作之一: someStringMethod(Integer.to
r - Bootstrapping : Error in statistic(data, 原始，...):未使用的参数(原始)
我有一个位置估计数据库，并且想要计算每月的内核利用率分布。我可以使用 R 中的 adehabitat 包来完成此操作，但我想使用引导数据库中的样本来估计这些值的 95% 置信区间。今天我一直在尝试引导
PowerShell 原始 FTP
我希望使用 FTP 编写大型机作业流。为此，我可以通过 FTP 连接到大型机并运行以下命令: QUOTE TYPE E QUOTE SITE FILETYPE=JES PUT myjob.jcl 那么
WPF:将画笔恢复为默认/原始
我是 WPF 的新手。目前，我正在为名为“LabeledTextbox”的表单元素制作一个用户控件，其中包含一个标签、一个文本框和一个用于错误消息的文本 block 。当使用代码添加错误消息时，我
SignalR(原始)不向客户端发送消息
我们正在使用 SignalR(原始版本，而不是 Core 版本)并注意到一些无法解释的行为。我们的情况如下: 我们有一个通过 GenericCommand() 方法接受命令的集线器(见下文)。这些命
Python请求 - 打印整个http请求(原始)？
使用 requests module 时，有没有办法打印原始 HTTP 请求？我不只想要标题，我想要请求行、标题和内容打印输出。是否可以看到最终由 HTTP 请求构造的内容？最佳答案 Since
你需要知道的三种VMware磁盘类型：原始、厚和精简
与直接访问现有本地磁盘或分区的物理磁盘相比，虚拟磁盘为文件存储提供更好的可移植性和效率。VMware有三种不同的磁盘类型：原始磁盘、厚磁盘和精简磁盘，它们各自分配不同的存储空间。 VMware
unity3d - 预制件(原始)和变体预制件有什么区别？
我有一个用一些颜色着色器等创建的门。前段时间我拖着门，它问我该怎么办时，我选择了变体。但现在我决定选择创建原始预制件和门颜色，或者着色器变成粉红色。这是资源中原始预制件和变体的屏幕截图。粉红色的
forms - Symfony2 form_label 原始
我想呈现原始翻译，所以我决定在 Twig 模板中使用“原始”选项。但它不起作用。例子: {{ form_label(form.sfGuardUserProfile.roules_acceptance)
sqlite - 文字(原始)值作为sqlite中的外键
是否可以在sqlite中制作类似的东西？ FOREIGN KEY(TypeCode, 'ARawValue', IdServeur) REFERENCES OTHERTABLE(TypeCode, T
geolocation - 原始 geoip 数据从何而来？
这个问题是一个更具体问题的一般版本 asked here .但是，这些答案无法使用。问题: geoIP数据的原始来源是什么？许多网站会告诉我我的 IP 在哪里，但它们似乎都在使用来自不到 5 家公
docker - Openshift/原始-基于Wildfly创建图像
对于Openshift:如何基于Wildfly创建docker镜像？这是使用的Dockerfile: FROM openshift/wildfly-101-centos7 # Install exa
Groovy 原始 double 算术
结果是 127 double middle = 255 / 2 虽然这产生了 127.5 Double middle = 255 / 2 同时这也会产生 127.5 double middle = (
delphi - 以编程方式逐个像素地交换小位图(原始)的颜色
在此处下载带有已编译可执行文件的源代码(大小:161 KB(165,230 字节)):http://www.eyeClaxton.com/download/delphi/ColorSwap.zip 原
string - 有没有办法在lua(原始)中定义自动转义字符串？
以下几行是我需要在 lua 中使用的任意正则表达式。 ['\";=] !^(?:(?:[a-z]{3,10}\s+(?:\w{3,7}?://[\w\-\./]*(?::\d+)?)?/[^?#]*(
geolocation - 原始 geoip 数据从何而来？
这个问题是一个更具体问题的一般版本 asked here .但是，这些答案无法使用。问题: geoIP数据的原始来源是什么？许多网站会告诉我我的 IP 在哪里，但它们似乎都在使用来自不到 5 家公
api - 原始.M数组字符串？以相同的结构响应http请求
我正在使用GoLang做服务器api，试图管理和回答所发出的请求。使用net/http和github.com/gorilla/mux。收到请求时，我使用以下结构创建响应: type Response
c++ - 原始 static_vector 实现中可能未定义的行为
tl; dr:我认为我的 static_vector 有未定义的行为，但我找不到它。这个问题是在 Microsoft Visual C++ 17 上。我有这个简单且未完成的 static_vecto
awk - 原始 awk 源代码的旧版本存档？
我试图找到原始 Awk (a/k/a One True Awk) 源代码的“历史”版本。我找到了 Kernighan's occasionally-updated site ，它似乎总是链接到最新版本
Python 原始 IPv6 套接字错误
我在 python 中使用原始 IPv6 套接字时遇到一些问题。我通过以下方式连接: if self._socket != None: # Close out old sock

首页

博学

6Ren·AI

商城

mvtnorm::pmvnorm 的 Rcpp 实现比原始 R 函数慢