gpt4 book ai didi

assembly - 具有延迟和吞吐量的简明 SSE 和 MMX 指令引用

转载 作者:行者123 更新时间:2023-12-04 00:48:51 25 4
gpt4 key购买 nike

我试图通过使用带有内联汇编的 MMX 和 SSE 指令集来优化一些算术。但是,我一直无法找到有关这些增强指令集的时序和用法的良好引用。你能帮我找到包含吞吐量、延迟、操作数以及指令简短描述信息的引用资料吗?

到目前为止,我发现:

英特尔指令引用
Intel 64 and IA-32 Architectures Developer's Manual: Vol. 2A
Intel 64 and IA-32 Architectures Developer's Manual: Vol. 2B

英特尔优化指南
http://www.intel.com/Assets/PDF/manual/248966.pdf

整数运算的时序
http://gmplib.org/~tege/x86-timing.pdf

最佳答案

英特尔指令引用应该为这些指令的实际作用提供足够的指导,我曾想过?它有每个人的伪代码,其操作的描述,在某些情况下甚至是一个典型案例的小图。

对于时间安排,我知道没有官方指南。 Agner Fog 的页面是标准引用:

http://www.agner.org/optimize/

关于assembly - 具有延迟和吞吐量的简明 SSE 和 MMX 指令引用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2961970/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com