gpt4 book ai didi

assembly - MOVDQA 和 MOVNTDQA 以及 WB/WC 标记区域的 VMOVDQA 和 VMOVNTDQ 之间有什么区别?

转载 作者:行者123 更新时间:2023-12-04 14:01:38 24 4
gpt4 key购买 nike

使用标记为WB(回写)和WC(写合并)的内存的指令之间的主要区别是什么:MOVDQA之间的区别是什么?和 MOVNTDQA ,以及 VMOVDQA 之间的区别是什么和 VMOVNTDQ ?

是不是,对于内存已标记为WC - 指令为[NT]与平常没有什么不同(没有 [NT] ),并且该内存标记为 WB - 指令为 [NT]把它当作内存 WC 使用吗?

最佳答案

您通常会使用 NT写入内存映射 IO(即:GPU 等)时的(非时间)指令,其中内存严格不可缓存且始终直接访问。

通过定期读取和写入,CPU 将在需要时尝试缓存较大的块并将其写入主内存。对于不可缓存的区域(例如 MMIO),写入必须直接进入内存,CPU 不会尝试缓存它们。使用 NT指令向 CPU 提示您可能正在流式传输大量数据(即:到帧缓冲区等),并且当它可以填充整个缓存行时,它将尝试组合这些写入。

“非时间”部分意味着您告诉 CPU 您不打算立即进行写入,而是可以在合理范围内延迟写入,直到足够 NT已发出指令以填充高速缓存行。

据我了解,您也可以使用 NT具有常规回写内存的指令,它不会尝试缓存这些写入,但也会在可以填充一行时尝试流式传输。在写入 WB 内存的情况下,我会说应用程序将非常专业,您需要知道在管理其缓存方面,您可以比 CPU 做得更好。此外,写入不会立即发生,因此之后读回的任何内容都会读取陈旧数据,直到执行组合写入。您需要使用 SFENCE 来管理它说明是否需要刷新任何未完成的组合写入。

最好直接从英特尔那里阅读——他们有很多关于这个主题的信息:

Increasing Memory Throughput With Intel® Streaming SIMD Extensions 4 (Intel® SSE4) Streaming Load

关于assembly - MOVDQA 和 MOVNTDQA 以及 WB/WC 标记区域的 VMOVDQA 和 VMOVNTDQ 之间有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19035677/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com