- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
假设我有两个线程来操作全局变量 x
.每个线程(或我假设的每个核心)都将有一个缓存副本 x
.
现在说Thread A
执行以下指令:
set x to 5
some other instruction
set x to 5
执行,缓存值
x
将设置为
5
,这将导致缓存一致性协议(protocol)采取行动并使用新值
x
更新其他内核的缓存。 .
x
实际上设置为
5
在
Thread A
的缓存,其他内核的缓存是否在
some other instruction
之前更新被执行?还是应该使用内存屏障来确保?:
set x to 5
memory barrier
some other instruction
set x to 5
被执行,
5
立即放置在线程 A 的缓存中(因此该指令未放置在队列中或稍后执行的内容中)。
最佳答案
x86 架构上存在的内存屏障 - 但一般来说这是正确的 - 不仅保证所有先前的加载或存储在执行任何后续加载或存储之前完成 - 它们还保证存储已成为 全局可见。
全局可见意味着其他缓存感知代理(如其他 CPU)可以看到存储。
如果目标内存已标记为不强制立即写入内存的缓存类型,则其他不知道缓存的代理(如支持 DMA 的设备)通常不会看到存储。
这与屏障本身无关,这是 x86 架构的一个简单事实:程序员可以看到缓存,并且在处理硬件时,它们通常被禁用。
英特尔在障碍的描述上故意通用,因为它不想将自己与特定的实现联系起来。
您需要抽象地思考:全局可见意味着硬件将采取所有必要步骤使商店全局可见。时期。
然而,要了解障碍,值得一看当前的实现。
请注意,英特尔可以随意将现代实现颠倒过来,只要它保持可见行为正确即可。
x86 CPU 中的存储在内核中执行,然后放置在存储缓冲区中。
例如 mov DWORD [eax+ebx*2+4], ecx
,一旦解码被停止,直到 eax
、 ebx
和 ecx
准备就绪2,然后它被分派(dispatch)到能够计算其地址的执行单元。
执行完成后,存储已成为移动到存储缓冲区中的一对(地址,值)。
据说该商店是在本地(在核心中)完成的。
存储缓冲区允许 CPU 的 OoO 部分忘记存储并认为它已完成,即使尚未尝试写入也是如此。
在特定事件(如序列化事件、异常、屏障的执行或缓冲区耗尽)时,CPU 会刷新存储缓冲区。
冲洗总是按顺序排列 - 先入先出。
存储从存储缓冲区进入缓存的领域。
如果目标地址标有 WC 缓存类型,则它可以合并到另一个称为 Write Combining 缓冲区的缓冲区中(然后绕过缓存写入内存),它可以写入 L1D 缓存、L2、如果缓存类型是 WB 或 WT,则 L3 或 LLC 如果它不是前一个之一。
如果缓存类型为UC或WT,也可以直接写入内存。
今天,这就是成为全局可见的意思:离开存储缓冲区。
注意两件非常重要的事情:
sfence
正是这样做的:WAITING所有先前的存储在本地完成,然后排空存储缓冲区。
mfence
会阻止稍后加载在全局可见(从 L1d 缓存中读取),直到存储缓冲区完成提交到缓存之后。)
sfence
是否等待存储传播到其他缓存中?
sfence
完成。
sfence
等通常都是无用的,相反,它们非常有用。
Memory ordering -- enforces --> Global visibility -- needs -> Cache coherency
'.______________________________'_____________.' '
Architectural ' '
'._______________________________________.'
micro-architectural
mov [eax+ebx*2+4], ecx
解码为两个独立的 uops:store-address 和 store-data。 store-address uop 必须等待 eax
和 ebx
准备就绪,然后将其分派(dispatch)到能够计算其地址的执行单元。该执行单元 writes the address into the store buffer ,因此稍后的加载(按程序顺序)可以检查存储转发。ecx
准备好时,store-data uop 可以调度到 store-data 端口,并将数据写入同一个存储缓冲区条目。关于assembly - 内存屏障是否确保缓存一致性已经完成?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42746793/
我阅读了有关 JSR 107 缓存 (JCache) 的内容。 我很困惑:据我所知,每个 CPU 都管理其缓存内存(无需操作系统的任何帮助)。 那么,为什么我们需要 Java 缓存处理程序? (如果C
好吧,我是 jQuery 的新手。我一直在这里和那里搞乱一点点并习惯它。我终于明白了(它并不像某些人想象的那么难)。因此,鉴于此链接:http://jqueryui.com/sortable/#dis
我正在使用 Struts 2 和 Hibernate。我有一个简单的表,其中包含一个日期字段,用于存储有关何时发生特定操作的信息。这个日期值显示在我的 jsp 中。 我遇到的问题是hibernate更
我有点不确定这里发生了什么,但是我试图解释正在发生的事情,也许一旦我弄清楚我到底在问什么,就可能写一个更好的问题。 我刚刚安装了Varnish,对于我的请求时间来说似乎很棒。这是一个Magneto 2
解决 Project Euler 的问题后,我在论坛中发现了以下 Haskell 代码: fillRow115 minLength = cache where cache = ((map fill
我正试图找到一种方法来为我网络上的每台计算机缓存或存储某些 python 包。我看过以下解决方案: pypicache但它不再被积极开发,作者推荐 devpi,请参见此处:https://bitbuc
我想到的一个问题是可以从一开始就缓存网络套接字吗?在我的拓扑中,我在通过双 ISP 连接连接到互联网的 HAProxy 服务器后面有 2 个 Apache 服务器(带有 Google PageSpee
我很难说出不同缓存区域 (OS) 之间的区别。我想简要解释一下磁盘\缓冲区\交换\页面缓存。他们住在哪里?它们之间的主要区别是什么? 据我了解,页面缓存是主内存的一部分,用于存储从 I/O 设备获取的
1.题目 请你为最不经常使用(LFU)缓存算法设计并实现数据结构。 实现 LFUCache 类: LFUCache(int capacity) - 用数据结构的容量 capacity 初始化对象 in
1.题目 请你设计并实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。 实现 LRUCache 类: ① LRUCache(int capacity) 以正整数作为容量 capacity
我想在访问该 View 时关闭某些页面的缓存。它适用于简单查询模型对象的页面。 好像什么时候 'django.middleware.cache.FetchFromCacheMiddleware', 启
documents为 ExePackage element state Cache属性的目的是 Whether to cache the package. The default is "yes".
我知道 docker 用图层存储每个图像。如果我在一台开发服务器上有多个用户,并且每个人都在运行相同的 Dockerfile,但将镜像存储为 user1_myapp . user2 将其存储为 use
在 Codeigniter 中没有出现缓存问题几年后,我发现了一个问题。我在其他地方看到过该问题,但没有适合我的解决方案。 例如,如果我在 View 中更改一些纯 html 文本并上传新文件并按 F5
我在 Janusgraph 文档中阅读了有关 Janusgraph Cache 的内容。关于事务缓存,我几乎没有怀疑。我在我的应用程序中使用嵌入式 janusgrah 服务器。 如果我只对例如进行读取
我想知道是否有来自终端的任何命令可以用来匹配 Android Studio 中执行文件>使缓存无效/重新启动的使用。 谢谢! 最佳答案 According to a JetBrains employe
我想制作一个 python 装饰器来内存函数。例如,如果 @memoization_decorator def add(a, b, negative=False): print "Com
我经常在 jQuery 事件处理程序中使用 $(this) 并且从不缓存它。如果我愿意的话 var $this = $(this); 并且将使用变量而不是构造函数,我的代码会获得任何显着的额外性能吗?
是的,我要说实话,我不知道varnish vcl,我可以解决一些基本问题,但是我不太清楚,这就是为什么我遇到问题了。 我正在尝试通过http请求设置缓存禁止,但是该请求不能通过DNS而是通过 Varn
在 WP 站点上加载约 4000 个并发用户时遇到此问题。 这是我的配置: F5 负载均衡器 ---> Varnish 4,8 核,32 Gb RAM ---> 9 个后端,4 个核,每个 16 RA
我是一名优秀的程序员,十分优秀!