gpt4 book ai didi

c++ - 关于英特尔的露天采矿示例

转载 作者:太空宇宙 更新时间:2023-11-04 11:26:41 25 4
gpt4 key购买 nike

以英特尔的露天采矿为例:

https://software.intel.com/en-us/articles/strip-mining-to-optimize-memory-use-on-32-bit-intel-architecture

为什么不将 Transform 和 Lighting 合并到一个循环中呢?它将解决缓存逐出问题。

有人在评论中问过同样的问题,但没有答案。

如果以某种方式拆分循环更快......为什么?在什么情况下我们应该拆分循环?

我浏览了几篇关于拆分循环的帖子,但我还是不明白。

最佳答案

如果这些操作中只有一个可以被矢量化,那么将它们组合起来可以防止循环的矢量化。在那种情况下,将数组分成缓存大小的 strip 会更好。我不知道这是否适用于 TransformLighting。如果不是,那么它们不一定是演示的好例子。

当循环部分可向量化(这是一个词吗?)而部分不可向量化时,裂变*通常是可行的方法。

*拆分实际上是根据 wikipedia 文章中使用的技术的名称。

关于c++ - 关于英特尔的露天采矿示例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26420985/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com