- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
使用标记为WB(回写)和WC(写合并)的内存的指令之间的主要区别是什么:MOVDQA
之间的区别是什么?和 MOVNTDQA
,以及 VMOVDQA
之间的区别是什么和 VMOVNTDQ
?
是不是,对于内存已标记为WC - 指令为[NT]
与平常没有什么不同(没有 [NT]
),并且该内存标记为 WB - 指令为 [NT]
把它当作内存 WC 使用吗?
最佳答案
您通常会使用 NT
写入内存映射 IO(即:GPU 等)时的(非时间)指令,其中内存严格不可缓存且始终直接访问。
通过定期读取和写入,CPU 将在需要时尝试缓存较大的块并将其写入主内存。对于不可缓存的区域(例如 MMIO),写入必须直接进入内存,CPU 不会尝试缓存它们。使用 NT
指令向 CPU 提示您可能正在流式传输大量数据(即:到帧缓冲区等),并且当它可以填充整个缓存行时,它将尝试组合这些写入。
“非时间”部分意味着您告诉 CPU 您不打算立即进行写入,而是可以在合理范围内延迟写入,直到足够 NT
已发出指令以填充高速缓存行。
据我了解,您也可以使用 NT
具有常规回写内存的指令,它不会尝试缓存这些写入,但也会在可以填充一行时尝试流式传输。在写入 WB 内存的情况下,我会说应用程序将非常专业,您需要知道在管理其缓存方面,您可以比 CPU 做得更好。此外,写入不会立即发生,因此之后读回的任何内容都会读取陈旧数据,直到执行组合写入。您需要使用 SFENCE
来管理它说明是否需要刷新任何未完成的组合写入。
最好直接从英特尔那里阅读——他们有很多关于这个主题的信息:
Increasing Memory Throughput With Intel® Streaming SIMD Extensions 4 (Intel® SSE4) Streaming Load
关于assembly - MOVDQA 和 MOVNTDQA 以及 WB/WC 标记区域的 VMOVDQA 和 VMOVNTDQ 之间有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19035677/
_mm_stream_load_si128被声明为 __m128i _mm_stream_load_si128 (__m128i * mem_addr) 而 _mm_load_si128被声明为 __
使用标记为WB(回写)和WC(写合并)的内存的指令之间的主要区别是什么:MOVDQA之间的区别是什么?和 MOVNTDQA ,以及 VMOVDQA 之间的区别是什么和 VMOVNTDQ ? 是不是,对
我是一名优秀的程序员,十分优秀!