gpt4 book ai didi

c++ - 使用 SSE/AVX 在 Ivy Bridge 上进行最大 SIMD 整数乘法?

转载 作者:太空宇宙 更新时间:2023-11-04 11:35:32 24 4
gpt4 key购买 nike

有人能告诉我如何通过 SSE/AVX 使用 SIMD 在 Ivy Bridge CPU 上同时计算 32 位无符号整数乘法的最大数量吗?

我知道 AVX 确实有用于乘法的 256 位寄存器,但这是用于 float 的(AVX2 引入了 256 位整数寄存器)。因此,我不太确定使用浮点寄存器进行整数乘法是否更好(如果可能的话)?

此外,我不确定它是否只对寄存器的数量有影响,或者我是否需要查看 CPU 的端口。看起来端口 0 和端口 5 可以处理 SSE 整数 ALU?

最佳答案

您可以每个时钟执行一次 pmulld = 4 次乘法。

Therefore I am not overly sure whether it would be better to use floating-point registers for integer multiplication (if thats even possible)?

那是不可能的。当然,您可以将 8 个整数放入 ymm 寄存器中,但这样就卡住了。你需要用它们做一些有用的指令在 AVX2 中。

关于c++ - 使用 SSE/AVX 在 Ivy Bridge 上进行最大 SIMD 整数乘法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23185029/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com