gpt4 book ai didi

performance - 未对准的存储和未对准的负载哪一个更昂贵?

转载 作者:行者123 更新时间:2023-12-04 04:54:03 24 4
gpt4 key购买 nike

假设我在两个相距 1024000+1 字节的数组之间复制数据。由于偏移量不是字大小的倍数,因此我需要进行一些未对齐的访问 - 加载或存储(目前,让我们忘记可以通过一些 ORing 和位移位来完全避免未对齐的访问)。未对齐的负载或未对齐的存储哪一个会更昂贵?

这是一个假设的情况,所以我不能只是对其进行基准测试:-) 我更感兴趣的是哪些因素会导致性能差异(如果有)。指向一些进一步阅读的指针会很棒。

谢谢!

最佳答案

未对齐的写入需要读取两个目标字,合并新数据,然后写入两个字。这将与对齐读取相结合。所以,3R + 2W。

未对齐的读取需要读取两个源字,并合并数据(移位和位)。这将与对齐写入相结合。所以,2R + 1W。

因此,未对齐的读取显然是赢家。

当然,正如您所说,有更有效的方法可以避免除数组末尾之外的任何未对齐操作。

关于performance - 未对准的存储和未对准的负载哪一个更昂贵?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17033696/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com