r - 使用 Rcpp 和 openMP 从截断正态分布快速采样-6ren

r - 使用 Rcpp 和 openMP 从截断正态分布快速采样

转载作者：行者123 更新时间：2023-12-02 03:39:03

更新:

我尝试实现德克的建议。评论？我现在在 JSM 很忙，但我想在为画廊编织 Rmd 之前得到一些反馈。我从 Armadillo 切换回普通 Rcpp，因为它没有增加任何值(value)。带 R::的标量版本非常好。如果将平均值/标准差作为标量输入，而不是作为所需输出长度的向量，我也许应该输入一个参数 n 来表示绘制次数。

<小时/>

有很多 MCMC 应用程序需要从截断正态分布中抽取样本。我在 TN 的现有实现的基础上构建并添加了并行计算。

问题:

有人认为速度还有进一步提升的潜力吗？ ~~在基准测试的最后一个案例中，rtruncnorm 有时更快。~~ Rcpp 实现总是比现有包更快，但它可以进一步改进吗？
我在一个无法共享的复杂模型中运行它，并且我的 R session 崩溃了。但是，我无法系统地重现它，因此它可能是代码的另一部分。如果有人正在使用 TN，请对其进行测试并告诉我。更新:更新后的代码没有遇到任何问题，请告诉我。

我如何将事情组合在一起:据我所知，最快的实现不在CRAN上，但源代码可以下载OSU stat 。在我的基准测试中，msm 和 truncorm 中的竞争实现速度较慢。诀窍是有效地调整提议分布，其中指数对于截断正态分布的尾部效果很好。因此，我采用了 Chris 的代码，对其进行了“Rcpp”编辑，并向其中添加了一些 openMP 香料。动态计划在这里是最佳的，因为采样可能需要更多或更少的时间，具体取决于边界。我发现一件令人讨厌的事情:当我想使用 double 时，许多统计分布都是基于 NumericVector 类型。我只是用我的方式解决了这个问题。

这是 Rcpp 代码:

#include <Rcpp.h>
#include <omp.h>


// norm_rs(a, b)
// generates a sample from a N(0,1) RV restricted to be in the interval
// (a,b) via rejection sampling.
// ======================================================================

// [[Rcpp::export]]

double norm_rs(double a, double b)
{
   double  x;
   x = Rf_rnorm(0.0, 1.0);
   while( (x < a) || (x > b) ) x = norm_rand();
   return x;
}

// half_norm_rs(a, b)
// generates a sample from a N(0,1) RV restricted to the interval
// (a,b) (with a > 0) using half normal rejection sampling.
// ======================================================================

// [[Rcpp::export]]

double half_norm_rs(double a, double b)
{
   double   x;
   x = fabs(norm_rand());
   while( (x<a) || (x>b) ) x = fabs(norm_rand());
   return x;
}

// unif_rs(a, b)
// generates a sample from a N(0,1) RV restricted to the interval
// (a,b) using uniform rejection sampling. 
// ======================================================================

// [[Rcpp::export]]

double unif_rs(double a, double b)
{
   double xstar, logphixstar, x, logu;

   // Find the argmax (b is always >= 0)
   // This works because we want to sample from N(0,1)
   if(a <= 0.0) xstar = 0.0;
   else xstar = a;
   logphixstar = R::dnorm(xstar, 0.0, 1.0, 1.0);

   x = R::runif(a, b);
   logu = log(R::runif(0.0, 1.0));
   while( logu > (R::dnorm(x, 0.0, 1.0,1.0) - logphixstar))
   {
      x = R::runif(a, b);
      logu = log(R::runif(0.0, 1.0));
   }
   return x;
}

// exp_rs(a, b)
// generates a sample from a N(0,1) RV restricted to the interval
// (a,b) using exponential rejection sampling.
// ======================================================================

// [[Rcpp::export]]

double exp_rs(double a, double b)
{
  double  z, u, rate;

//  Rprintf("in exp_rs");
  rate = 1/a;
//1/a

   // Generate a proposal on (0, b-a)
   z = R::rexp(rate);
   while(z > (b-a)) z = R::rexp(rate);
   u = R::runif(0.0, 1.0);

   while( log(u) > (-0.5*z*z))
   {
      z = R::rexp(rate);
      while(z > (b-a)) z = R::rexp(rate);
      u = R::runif(0.0,1.0);
   }
   return(z+a);
}




// rnorm_trunc( mu, sigma, lower, upper)
//
// generates one random normal RVs with mean 'mu' and standard
// deviation 'sigma', truncated to the interval (lower,upper), where
// lower can be -Inf and upper can be Inf.
//======================================================================

// [[Rcpp::export]]
double rnorm_trunc (double mu, double sigma, double lower, double upper)
{
int change;
 double a, b;
 double logt1 = log(0.150), logt2 = log(2.18), t3 = 0.725;
 double z, tmp, lograt;

 change = 0;
 a = (lower - mu)/sigma;
 b = (upper - mu)/sigma;

 // First scenario
 if( (a == R_NegInf) || (b == R_PosInf))
   {
     if(a == R_NegInf)
       {
     change = 1;
     a = -b;
     b = R_PosInf;
       }

     // The two possibilities for this scenario
     if(a <= 0.45) z = norm_rs(a, b);
     else z = exp_rs(a, b);
     if(change) z = -z;
   }
 // Second scenario
 else if((a * b) <= 0.0)
   {
     // The two possibilities for this scenario
     if((R::dnorm(a, 0.0, 1.0,1.0) <= logt1) || (R::dnorm(b, 0.0, 1.0, 1.0) <= logt1))
       {
     z = norm_rs(a, b);
       }
     else z = unif_rs(a,b);
   }
 // Third scenario
 else
   {
     if(b < 0)
       {
     tmp = b; b = -a; a = -tmp; change = 1;
       }

     lograt = R::dnorm(a, 0.0, 1.0, 1.0) - R::dnorm(b, 0.0, 1.0, 1.0);
     if(lograt <= logt2) z = unif_rs(a,b);
     else if((lograt > logt1) && (a < t3)) z = half_norm_rs(a,b);
     else z = exp_rs(a,b);
     if(change) z = -z;
   }
   double output;
   output = sigma*z + mu;
 return (output);
}


// rtnm( mu, sigma, lower, upper, cores)
//
// generates one random normal RVs with mean 'mu' and standard
// deviation 'sigma', truncated to the interval (lower,upper), where
// lower can be -Inf and upper can be Inf.
// mu, sigma, lower, upper are vectors, and vectorized calls of this function
// speed up computation
// cores is an intege, representing the number of cores to be used in parallel
//======================================================================


// [[Rcpp::export]]

Rcpp::NumericVector rtnm(Rcpp::NumericVector mus, Rcpp::NumericVector sigmas, Rcpp::NumericVector lower, Rcpp::NumericVector upper, int cores){
  omp_set_num_threads(cores);
  int nobs = mus.size();
  Rcpp::NumericVector out(nobs);
  double logt1 = log(0.150), logt2 = log(2.18), t3 = 0.725;
    double a,b, z, tmp, lograt;

     int  change;

  #pragma omp parallel for schedule(dynamic)   
  for(int i=0;i<nobs;i++) {  

     a = (lower(i) - mus(i))/sigmas(i);
     b = (upper(i) - mus(i))/sigmas(i);
     change=0;
     // First scenario
     if( (a == R_NegInf) || (b == R_PosInf))
       {
         if(a == R_NegInf)
           {
              change = 1;
              a = -b;
              b = R_PosInf;
           }

         // The two possibilities for this scenario
         if(a <= 0.45) z = norm_rs(a, b);
         else z = exp_rs(a, b);
         if(change) z = -z;
       }
     // Second scenario
     else if((a * b) <= 0.0)
       {
         // The two possibilities for this scenario
         if((R::dnorm(a, 0.0, 1.0,1.0) <= logt1) || (R::dnorm(b, 0.0, 1.0, 1.0) <= logt1))
           {
                z = norm_rs(a, b);
           }
         else z = unif_rs(a,b);
       }

     // Third scenario
     else
       {
         if(b < 0)
           {
                tmp = b; b = -a; a = -tmp; change = 1;
           }

         lograt = R::dnorm(a, 0.0, 1.0, 1.0) - R::dnorm(b, 0.0, 1.0, 1.0);
         if(lograt <= logt2) z = unif_rs(a,b);
         else if((lograt > logt1) && (a < t3)) z = half_norm_rs(a,b);
         else z = exp_rs(a,b);
         if(change) z = -z;
       }
    out(i)=sigmas(i)*z + mus(i);          
  }

return(out);
}

这是基准:

libs=c("truncnorm","msm","inline","Rcpp","RcppArmadillo","rbenchmark")
if( sum(!(libs %in% .packages(all.available = TRUE)))>0){ install.packages(libs[!(libs %in% .packages(all.available = TRUE))])}
for(i in 1:length(libs)) {library(libs[i],character.only = TRUE,quietly=TRUE)}


#needed for openMP parallel
Sys.setenv("PKG_CXXFLAGS"="-fopenmp")
Sys.setenv("PKG_LIBS"="-fopenmp")

#no of cores for openMP version
cores = 4

#surce code from same dir
Rcpp::sourceCpp('truncnorm.cpp')


#sample size
nn=1000000


bb= 100
aa=-100
benchmark( rtnm(rep(0,nn),rep(1,nn),rep(aa,nn),rep(100,nn),cores), rtnm(rep(0,nn),rep(1,nn),rep(aa,nn),rep(100,nn),1),rtnorm(nn,rep(0,nn),rep(1,nn),rep(aa,nn),rep(100,nn)),rtruncnorm(nn, a=aa, b=100, mean = 0, sd = 1) , order="relative", replications=3    )[,1:4]

aa=0 
benchmark( rtnm(rep(0,nn),rep(1,nn),rep(aa,nn),rep(100,nn),cores), rtnm(rep(0,nn),rep(1,nn),rep(aa,nn),rep(100,nn),1),rtnorm(nn,rep(0,nn),rep(1,nn),rep(aa,nn),rep(100,nn)),rtruncnorm(nn, a=aa, b=100, mean = 0, sd = 1) , order="relative", replications=3    )[,1:4]

aa=2
benchmark( rtnm(rep(0,nn),rep(1,nn),rep(aa,nn),rep(100,nn),cores), rtnm(rep(0,nn),rep(1,nn),rep(aa,nn),rep(100,nn),1),rtnorm(nn,rep(0,nn),rep(1,nn),rep(aa,nn),rep(100,nn)),rtruncnorm(nn, a=aa, b=100, mean = 0, sd = 1) , order="relative", replications=3    )[,1:4]

aa=50
benchmark( rtnm(rep(0,nn),rep(1,nn),rep(aa,nn),rep(100,nn),cores), rtnm(rep(0,nn),rep(1,nn),rep(aa,nn),rep(100,nn),1),rtnorm(nn,rep(0,nn),rep(1,nn),rep(aa,nn),rep(100,nn)),rtruncnorm(nn, a=aa, b=100, mean = 0, sd = 1) , order="relative", replications=3    )[,1:4]

由于速度取决于上/下边界，因此需要进行多次基准测试。对于不同的情况，算法的不同部分会起作用。

最佳答案

非常快速的评论:

如果您包含 RcppArmadillo.h您不需要包括 Rcpp.h -- 事实上，您不应该这样做，我们甚至对此进行了测试
rep(oneDraw, n)调用 n 次电话。我会编写一个调用一次的函数，返回 n 次绘制——它会更快，因为你可以节省 n-1 次函数调用开销
您对许多统计分布的评论均基于 NumericVector类型，当我想使用 double 时可能会揭示一些误解:NumericVector是我们方便的内部 R 类型的代理类:没有副本。您可以随意使用std::vector<double>或您喜欢的任何形式。
我对截断法线知之甚少，因此无法评论您的算法的具体细节。
一旦你解决了这个问题，请考虑发布一个关于 Rcpp Gallery 的帖子。 .

关于r - 使用 Rcpp 和 openMP 从截断正态分布快速采样，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17915234/

文章推荐： gruntjs - 如何使用 grunt-usemin 处理 css 的绝对 url

文章推荐： Java-输出不打印

文章推荐： macos - Matlab 绘图 - 字体 Zapf Dingbats 不会呈现

文章推荐： java - 如何在 Spring Boot 应用程序中模拟外部依赖关系？

rcpp - 如何在 Rcpp 的函数参数中将默认值设置为 Rcpp::Function？
我想将函数参数中的默认值设置为 Rcpp::Function 参数。只是简单的赋值，Rcpp::Function func = mean ，不可能。它返回错误:no viable conversi
rcpp - Rcpp 中的逐元素矩阵乘法
我正在处理需要逐元素矩阵乘法的代码。我试图在 Rcpp 中实现这一点，因为代码需要一些昂贵的循环。我对 Rcpp 还很陌生，可能会遗漏一些东西，但我无法使逐元素矩阵乘法工作。 // [[Rcpp::e
rcpp - 在 Rcpp 中声明一个变量作为引用
在 C++ 中，我们可以声明一个变量作为引用。 int a = 10; int& b = a; 如果我们设置 b=15 ， a 也会改变。我想在 Rcpp 中做类似的事情。 List X = obj
rcpp - 在 Rcpp 函数中将类作为参数传递
我正在阅读很棒的 Rcpp vignette关于使用 Rcpp 模块公开 C++ 类和函数。在这种情况下，是否可以创建一个 Rcpp 函数，该函数具有一个类型为 Uniform 的类作为参数之一，并且
rcpp - 迭代 Rcpp 中的命名列表
我在 R 中有一个命名列表: l = list(a=1, b=2) 我想在 Rcpp 中使用这个列表，并迭代值和名称。理想情况下，它可能类似于(为简洁起见使用 C++11 格式): void prin
rcpp - 使用 Rcpp 将目标文件链接到函数的简化示例
这个问题在这里已经有了答案: Rcpp - sourceCpp - undefined symbol (2 个答案) 关闭 4 年前。我现有的 C 代码由三个文件组成:头文件(“.h”文件)、库文
c++ - Rcpp 错误 : invalid static_cast from type 'Rcpp::Vector<13, Rcpp::PreserveStorage>' to type 'int'
我目前正在为类作业编写模拟退火算法(“解决”背包问题)，并想在 Rcpp 中完成(我必须使用 R，而 Rcpp 更快)。 Rcpp 一直给我以下错误 invalid static_cast from
c++ - 在 Rcpp 和 C++ 之间转换 vector (使用 Rcpp::as 或 Rcpp::wrap)是否会创建一个新 vector 并复制元素？
根据我的理解，在 Rcpp 和 C++ 之间转换 vector 会创建新 vector ，如下所示。我的理解对吗？将 Rcpp vector 转换为 C++ vector 时，我们使用 Rcpp::
rcpp - 为 Rcpp 函数中的参数设置默认值 `NULL`
我想将参数的默认值设置为 NULL在Rcpp如果参数不是NULL，则函数并根据参数进行一些计算.这种代码的一个例子是 #include using namespace Rcpp; // [[Rcpp
rcpp - Rcpp NumericMatrix 在左/右乘以标量时的奇怪行为
任何人都可以解释以下行为吗？当声明一个新的NumericMatrix时，y，作为原始矩阵，x，乘以一个标量，c，标量/矩阵乘法的顺序很重要。如果我将左侧的标量与右侧的矩阵相乘(例如 NumericM
rcpp - 在 Rcpp 中将矩阵初始化为 NA
有一种方法可以使用 NA 值初始化数值向量，例如。 NumericVector x(10,NumericVector::get_na()) 有没有类似的方法可以将矩阵初始化为 NA 值？最佳答案这
rcpp - 从 Rcpp 中的列表中提取 data.frame
这可能是一个非常简单的问题，但我不知道哪里出了问题。我有一个传递给 Rcpp 函数的列表，该列表的第一个元素是一个 data.frame。我如何获取该 data.frame？ bar = list
rcpp - 使用 Rcpp 在 R 包中添加外部库
我正在尝试开发一个使用 Sundials 的 R 包用于求解微分方程的 C 库。为了不让用户安装库，我将库的源代码放在我的包中。我已将库中的所有头文件放入 /inst/include/sundial
c++ - 根据 Rcpp.h 为自定义类扩展 Rcpp::as
我正在研究一个同时使用 Rcpp::IntegerVector (行/列指针)和模板化 std::vector 的 Rcpp 稀疏矩阵类。基本原理是，在极大的稀疏矩阵中深度复制整数指针 vector
Rcpp:如何获取 Rcpp::Nullable NumericVector 的大小
我想将一个R函数翻译成Rcpp，一个简单的测试代码如下，但我不知道如何处理默认设置为NULL的参数。 test t=R_NilValue, Rcpp
Rcpp:如何获取 Rcpp::Nullable NumericVector 的大小
我想将一个R函数翻译成Rcpp，一个简单的测试代码如下，但我不知道如何处理默认设置为NULL的参数。 test t=R_NilValue, Rcpp
c++ - 混合 Rcpp 模块和 Rcpp::export
我想公开一个 C++ 类和一个将该类的对象作为 R 参数的函数。我必须遵循简化的示例。我使用创建了一个包 Rscript -e 'Rcpp::Rcpp.package.skeleton("soq")'
Rcpp:从 Rcpp 中的包调用 C 函数
我想用 Rcpp 编写一个 C++ 函数，它使用 hypred 包中的 C 函数，它在 CRAN here 上. 我读了using C function from other package in R
c++ - Rcpp:使用 Rcpp 数据帧时推荐的代码结构(内联)
[我在别处将其草拟为评论，但决定创建一个适当的问题...] 在 Rcpp 中使用数据帧时，就代码结构而言，目前被认为是“最佳实践”的是什么？从 R 到 C++ 代码的输入数据帧“传输”非常容易，但是如
c++ - 将 Rcpp 对象分配到 Rcpp 列表中会产生最后一个元素的拷贝
我正在尝试使用 Rcpp::CharacterMatrix 并将每一行转换为 Rcpp::List 中它自己的元素。但是，我为此编写的函数有一个奇怪的行为，即列表的每个条目都对应于矩阵的最后一行。为

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

r - 使用 Rcpp 和 openMP 从截断正态分布快速采样