gpt4 book ai didi

c++ - C++中的快速内存访问?

转载 作者:IT王子 更新时间:2023-10-28 23:38:48 24 4
gpt4 key购买 nike

在使用 C++ 快速访问内存方面开发游戏时应该考虑什么?

我加载的内存是静态的,所以我应该放入一个连续的内存块中,对吧?

另外,我应该如何组织结构中的变量以提高性能?

最佳答案

内存性能非常模糊。

我认为您正在寻找的是关于处理 CPU 缓存,因为在缓存中的访问和主内存中的访问之间存在大约 10 倍。

有关缓存背后机制的完整引用,您可能希望阅读 Ulrich Drepper on lwn.net 的这篇优秀文章系列。 .

简而言之:

瞄准地方

您不应该在内存中乱跳,因此请尝试(如果可能)将要一起使用的项目组合在一起。

以可预测性为目标

如果您的内存访问是可预测的,则 CPU 可能会为下一个工作 block 预取内存,以便在完成当前 block 后立即或很快可用。

典型的例子是在数组上使用 for 循环:

for (int i = 0; i != MAX; ++i)
for (int j = 0; j != MAX; ++j)
array[i][j] += 1;

array[i][j] += 1; 更改为 array[j][i] += 1; 并且性能会有所不同......在低优化级别;)

编译器应该捕捉到那些明显的情况,但有些情况更隐蔽。例如,使用基于节点的容器(链表、二叉搜索树)而不是基于数组的容器( vector 、一些哈希表)可能会降低应用程序的速度。

不要浪费空间...谨防虚假分享

尝试打包您的结构。这与对齐有关,您可能会因为结构中的对齐问题而浪费空间,这会人为地增大结构大小并浪费缓存空间。

一个典型的经验法则是通过减小大小对结构中的项目进行排序(使用 sizeof)。这很愚蠢,但效果很好。如果您对大小和对齐方式有更多了解,请避免空洞:) 注意:仅对具有大量实例的结构有用...

但是,请注意虚假分享。在多线程程序中,并发访问足够接近以共享同一缓存行的两个变量的成本很高,因为它涉及大量缓存失效和 CPU 争夺缓存行所有权。

个人资料

不幸的是,这很难弄清楚。

如果你碰巧在 Unix 上编程,Callgrind(Valgrind 套件的一部分)可以通过缓存模拟运行并识别触发缓存未命中的代码部分。

我猜还有其他工具,我只是没用过。

关于c++ - C++中的快速内存访问?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6762610/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com