gpt4 book ai didi

c++ - runif 的性能

转载 作者:太空狗 更新时间:2023-10-29 23:50:27 27 4
gpt4 key购买 nike

我正在针对特定问题开发自定义引导算法,并且由于我需要大量重复,所以我确实关心性能。对此,我对如何正确使用runif有一些疑问。我知道我可以自己运行基准测试,但 C++ 优化往往很困难,我也想了解任何差异的原因。

第一个问题:

第一个代码块比第二个快吗?

for (int i = 0; i < n_boot; i++) {
new_random = runif(n); //new_random is pre-allocated in class
// do something with the random numbers
}

for (int i = 0; i < n_boot; i++) {
NumericVector new_random = runif(n);
// do something with the random numbers
}

这可能归结为 runif 是否填充左侧,或者它是否分配并传递一个新的 NumericVector。

第二个问题:

如果两个版本都分配一个新 vector ,我可以通过在标量模式下一次生成一个随机数来改进吗?

如果您想知道,内存分配占用了我处理时间的相当大一部分。通过优化其他不必要的内存分配,我将运行时间减少了 30%,所以这很重要。

最佳答案

我设置了以下 struct 以尝试准确地表示您的场景并促进基准测试:

#include <Rcpp.h>
// [[Rcpp::plugins(cpp11)]]

struct runif_test {

size_t runs;
size_t each;

runif_test(size_t runs, size_t each)
: runs(runs), each(each)
{}
// Your first code block
void pre_init() {
Rcpp::NumericVector v = no_init();
for (size_t i = 0; i < runs; i++) {
v = Rcpp::runif(each);
}
}
// Your second code block
void post_init() {
for (size_t i = 0; i < runs; i++) {
Rcpp::NumericVector v = Rcpp::runif(each);
}
}
// Generate 1 draw at a time
void gen_runif() {
Rcpp::NumericVector v = no_init();
for (size_t i = 0; i < runs; i++) {
std::generate_n(v.begin(), each, []() -> double {
return Rcpp::as<double>(Rcpp::runif(1));
});
}
}
// Reduce overhead of pre-allocated vector
inline Rcpp::NumericVector no_init() {
return Rcpp::NumericVector(Rcpp::no_init_vector(each));
}
};

我在其中对以下导出函数进行了基准测试:

// [[Rcpp::export]]
void do_pre(size_t runs, size_t each) {
runif_test obj(runs, each);
obj.pre_init();
}

// [[Rcpp::export]]
void do_post(size_t runs, size_t each) {
runif_test obj(runs, each);
obj.post_init();
}

// [[Rcpp::export]]
void do_gen(size_t runs, size_t each) {
runif_test obj(runs, each);
obj.gen_runif();
}

这是我得到的结果:

R>  microbenchmark::microbenchmark(
do_pre(100, 10e4)
,do_post(100, 10e4)
,do_gen(100, 10e4)
,times=100L)
Unit: milliseconds
expr min lq mean median uq max neval
do_pre(100, 100000) 109.9187 125.0477 145.9918 136.3749 152.9609 337.6143 100
do_post(100, 100000) 103.1705 117.1109 132.9389 130.4482 142.7319 204.0951 100
do_gen(100, 100000) 810.5234 911.3586 1005.9438 986.8348 1062.7715 1501.2933 100

R>  microbenchmark::microbenchmark(
do_pre(100, 10e5)
,do_post(100, 10e5)
,times=100L)
Unit: seconds
expr min lq mean median uq max neval
do_pre(100, 1000000) 1.355160 1.614972 1.740807 1.723704 1.815953 2.408465 100
do_post(100, 1000000) 1.198667 1.342794 1.443391 1.429150 1.519976 2.042511 100

所以,假设我解释/准确地表达了你的第二个问题,

If both versions allocate a new vector, can I improve things by generating one random number at a time in scalar mode?

使用我的 gen_runif() 成员函数,我想我们可以自信地说这不是最佳方法 - 比其他两个函数慢 7.5 倍。

更重要的是,为了解决您的第一个问题,似乎仅初始化并将新的 NumericVector 分配给 Rcpp::runif(n)< 的输出会更快一些。我当然不是 C++ 专家,但我相信第二种方法(分配给一个新的本地对象)比第一种更快,因为 copy elision .在第二种情况下,看起来好像正在创建两个对象 - = 左侧的对象、v 和一个 ( = 右侧的临时?右值?)对象,这是 Rcpp::runif() 的结果。但实际上,编译器很可能会优化这个不必要的步骤 - 我认为我链接的文章中的这段话对此进行了解释:

When a nameless temporary, not bound to any references, would be moved or copied into an object of the same type ... the copy/move is omitted. When that temporary is constructed, it is constructed directly in the storage where it would otherwise be moved or copied to.

至少,我是这样解释结果的。希望更精通该语言的人可以确认/否认/纠正这个结论。

关于c++ - runif 的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30253275/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com