gpt4 book ai didi

c++ - 大std::vector的加速创建

转载 作者:行者123 更新时间:2023-12-01 14:58:15 26 4
gpt4 key购买 nike

在我的国际象棋引擎代码库中,我使用了一个非常大的哈希表,哈希表的大小最多可以达到128 GB。
hast表是由大小为4的存储桶组成的大型数组。使用STL std::vector完成管理该大型表的代码。我对代码的性能感到满意,但是在初始化结构时遇到了一些问题。

哈希表的结构如下:

class ttEntry
{
private:

signed int key:32; /*! 32 bit for the upper part of the key*/
signed int packedMove:16; /*! 16 bit for the move*/
signed int depth:16; /*! 16 bit for depth*/
signed int value:23; /*! 23 bit for the value*/
signed int generation:8; /*! 8 bit for the generation id*/
signed int staticValue:23; /*! 23 bit for the static evalutation (eval())*/
signed int type:3; /*! 2 bit for the type of the entry*/
/* 144 bits total = 16 bytes*/
public:
explicit ttEntry(unsigned int _Key, Score _Value, unsigned char _Type, signed short int _Depth, unsigned short _Move, Score _StaticValue, unsigned char _gen): key(_Key), packedMove(_Move), depth(_Depth), value(_Value), generation(_gen), staticValue(_StaticValue), type(_Type){}
explicit ttEntry(){}

...
...
};

using ttCluster = std::array<ttEntry, 4>;



class transpositionTable
{
private:
std::vector<ttCluster> _table;
....
....
}

我的分配空间的代码如下:
uint64_t transpositionTable::setSize(unsigned long int mbSize)
{

uint64_t size = (uint64_t)((((uint64_t)mbSize) << 20) / sizeof(ttCluster));
_elements = size;

_table.clear();
_table.shrink_to_fit();
try
{
_table.reserve(_elements);
_table.resize(_elements); // big bottleneck
}
catch(...)
{
std::cerr << "Failed to allocate " << mbSize<< "MB for transposition table." << std::endl;
exit(EXIT_FAILURE);
}
return _elements * 4;
}

要使用128GB的内存初始化表108秒。我对用已知值初始化内存不感兴趣,而只是分配空间并具有足够长的std::vector。

我知道我可以使用良好的旧C代码和malloc重写代码,但我想使用现代的std::vector。

关于如何加速代码以及我在哪里做错的任何想法吗?

在@MarcGlisse和@​​Bob__提示之后,我将代码修改为:


//
//https://stackoverflow.com/questions/21028299/is-this-behavior-of-vectorresizesize-type-n-under-c11-and-boost-container/21028912#21028912
//
// Allocator adaptor that interposes construct() calls to
// convert value initialization into default initialization.
template <typename T, typename A=std::allocator<T>>
class default_init_allocator : public A {
typedef std::allocator_traits<A> a_t;
public:
template <typename U> struct rebind {
using other =
default_init_allocator<
U, typename a_t::template rebind_alloc<U>
>;
};

using A::A;

template <typename U>
void construct(U* ptr)
noexcept(std::is_nothrow_default_constructible<U>::value) {
::new(static_cast<void*>(ptr)) U;
}
template <typename U, typename...Args>
void construct(U* ptr, Args&&... args) {
a_t::construct(static_cast<A&>(*this),
ptr, std::forward<Args>(args)...);
}
};

class transpositionTable
{
private:
std::vector<ttCluster, default_init_allocator<ttCluster>> _table;
...
...

现在可以更快地进行大小调整(8GB少于1秒),并且在调整大小后,板上的所有元素都填充为0。

感谢你们

最佳答案

为什么仍然需要调整大小?正如我所看到的,保留 call 可以满足您的所有需求。它为特定大小分配内存。
由于您想稍后对其进行初始化,因此只需使用push_back将数据写入其中即可。
由于不必进行分配,因此与仅写入 vector 元素相比,push_back基本上没有性能损失。

关于c++ - 大std::vector的加速创建,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59542267/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com