gpt4 book ai didi

c++ - STL模板的特化

转载 作者:行者123 更新时间:2023-11-30 04:58:57 28 4
gpt4 key购买 nike

我正在尝试使用 Mersenne Twister 编写使用随机数的高性能代码。大约需要 ~5ns生成随机 unsigned long long .这用于生成 double ,但是,这些需要 ~40ns在分布中生成。

查看STL代码double由分布生成的 s 是通过调用 std::generate_canonical 生成的,其中涉及 std::ceilstd::log2操作,我相信是这些是成本高昂的。

这些操作是不必要的,因为它们用于计算调用任何 RNG 实现所需的位数。因为这是在编译时间之前已知的,所以我编写了自己的实现,不进行这些调用,并且生成 double 的时间。是~15ns .

是否可以特化一个模板化的 STL 函数?如果是这样,这是如何实现的,到目前为止,我的尝试导致原始功能仍在使用。我想专门研究这个 STL 函数,因为我仍然想使用 <random> 中的分布.

这是在 Visual C++ 中进行的,但是一旦代码开发完成,它将在 Linux 上运行并使用 GCC 或 ICC。如果在 Linux 上生成 double 的方法不同(并且更快),则此问题无关紧要。

编辑 1:

我相信所有发行版都需要对 std::generate_canonical 进行两次调用,此函数在 [0,1) 范围内创建一个 double ,并通过迭代添加对 RNG operator() 的调用来创建正确的精度. log2ceil用于计算迭代次数。

MSVC std::generate_canonical

// FUNCTION TEMPLATE generate_canonical
template<class _Real,
size_t _Bits,
class _Gen>
_Real generate_canonical(_Gen& _Gx)
{ // build a floating-point value from random sequence
_RNG_REQUIRE_REALTYPE(generate_canonical, _Real);

const size_t _Digits = static_cast<size_t>(numeric_limits<_Real>::digits);
const size_t _Minbits = _Digits < _Bits ? _Digits : _Bits;

const _Real _Gxmin = static_cast<_Real>((_Gx.min)());
const _Real _Gxmax = static_cast<_Real>((_Gx.max)());
const _Real _Rx = (_Gxmax - _Gxmin) + static_cast<_Real>(1);

const int _Ceil = static_cast<int>(_STD ceil(
static_cast<_Real>(_Minbits) / _STD log2(_Rx)));
const int _Kx = _Ceil < 1 ? 1 : _Ceil;

_Real _Ans = static_cast<_Real>(0);
_Real _Factor = static_cast<_Real>(1);

for (int _Idx = 0; _Idx < _Kx; ++_Idx)
{ // add in another set of bits
_Ans += (static_cast<_Real>(_Gx()) - _Gxmin) * _Factor;
_Factor *= _Rx;
}

return (_Ans / _Factor);
}

我的简化版

template<size_t _Bits>
double generate_canonical(std::mt19937_64& _Gx)
{ // build a floating-point value from random sequence
const double _Gxmin = static_cast<double>((_Gx.min)());
const double _Gxmax = static_cast<double>((_Gx.max)());
const double _Rx = (_Gxmax - _Gxmin) + static_cast<double>(1);

double _Ans = (static_cast<double>(_Gx()) - _Gxmin);

return (_Ans / _Rx);
}

这个函数写在namespace std {}

编辑 2:

我找到了解决方案,请在下面查看我的回答。

最佳答案

抱歉,不允许特化标准库函数;这样做会导致未定义的行为。

但是,您可以使用其他发行版; C++ 在生成器和分布之间有明确定义的接口(interface)。

哦,只是为了消除初学者错误的可能性(因为您没有显示代码):您不要为每个数字创建一个新的分布。

关于c++ - STL模板的特化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51444434/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com