gpt4 book ai didi

c++ - 访问未初始化的值会导致性能下降吗?

转载 作者:太空狗 更新时间:2023-10-29 20:44:56 24 4
gpt4 key购买 nike

我正在优化矩阵数值热点。

目前,我正在做阻塞和 loop unrolling以提高性能。但是,我故意避免剥离边界。相反,我让阻塞步骤溢出,当然,算法然后会触及未初始化的值。

但是,矩阵已预先分配好以应对溢出,因此我实际上并没有非法访问内存位置。

我不去皮有几个原因:

  • 懒惰
  • 由于边界剥落情况的局部性非常差,性能受到影响。
  • 避免复杂的边框剥离代码。

但是,我想知道这些接触未初始化值的溢出访问是否真的会导致性能下降?

我可以预料地知道未初始化的访问发生在哪里,并且它们也通过 valgrind 报告。我还使用 Intel 的 VTune 对代码进行了分析,没有发现任何迹象表明性能会因此下降。

最佳答案

只是为了避免迂腐的东西:

根据标准,如果使用未初始化的数据,可能会发生不好的事情。 (该标准允许使用可能触发异常的“陷阱”值。)但出于所有实际目的,这可能不适用于此处。


如果您正在处理整数,访问和操作未初始化的数据将不会影响性能。 (除除法外,所有操作通常都是固定延迟)

对于 float ,有两个问题:

  1. Signalling NaNs
  2. Denormalized Values

根据环境,发出 NaN 信号可能会触发硬件异常。所以这实际上是一个正确性问题,而不仅仅是性能问题。

非正规 float 与此有任何关系,这可能违反直觉。然而,未初始化的数据很可能被反规范化

And you really don't want to be messing with denormalized floating-point.

因此,如果您运气不佳,未初始化的值甚至有一个非规范化值,您可能会在每次循环迭代结束时遭受 100+ 次循环惩罚。现在取决于循环有多大,这可能重要也可能不重要。

也就是说,为什么未初始化的数据容易被反规范化?如果浮点值的前几位为零,则它被反规范化。就这么简单。如果数据曾经是整数或 64 位指针...当重新解释为浮点值时,它将被非规范化。


建议:

  • 零初始化数据。如果成本太高,至少对端点进行零初始化。
  • 通过放入清理代码避免访问未初始化的数据。类似于 Duff's Device可能是合适的。虽然我通常更喜欢一组二进制减少 if 语句。

关于c++ - 访问未初始化的值会导致性能下降吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11944079/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com