- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
假设我有事实上的标准 x86 CPU,具有 3 级缓存,L1/L2 私有(private),L3 在内核之间共享。有没有办法分配共享内存,其数据不会缓存在 L1/L2 私有(private)缓存中,而只会缓存在 L3 中?我不想从内存中获取数据(这太昂贵了),但我想在将共享数据放入私有(private)缓存和不将共享数据放入私有(private)缓存的情况下进行性能试验。
假设 L3 在核心之间共享(大概是物理索引缓存),因此不会导致任何错误共享或缓存行失效对于频繁使用的共享数据。
任何解决方案(如果存在的话)都必须以编程方式完成,使用 C 语言和/或针对基于英特尔 CPU 的程序集(相对现代的至强架构(skylake、broadwell),运行基于 linux 的操作系统。
编辑:
我有延迟敏感的代码,它使用一种共享内存的形式来进行同步。数据将在 L3 中,但在读取或写入时将根据缓存包容性策略进入 L1/L2。根据该问题的暗示,数据将不得不无效,从而增加不必要的(我认为)性能损失。我想看看是否可以仅通过某些页面策略或仅在 L3 中的特殊说明来存储数据。
我知道出于安全原因可以使用特殊内存寄存器来禁止缓存,但这需要 CPL0 权限。
编辑2:
我正在处理在高性能系统上运行数月的并行代码。这些系统是高核心数系统(例如 40-160+ 核心),定期执行需要在 usecs 中执行的同步。
最佳答案
x86 无法通过 L1D/L2 而不是 L3 进行绕过或写入的存储。有绕过所有缓存的 NT 商店。任何强制回写到 L3 的操作也会强制一直回写到内存。 (例如 clwb
指令)。这些专为非 volatile RAM 用例或非相干 DMA 而设计,在这些用例中,将数据提交到实际 RAM 很重要。
也没有办法进行绕过 L1D 的加载(除了使用 SSE4.1 movntdqa
的 USWC 内存,但它在其他内存类型上不是“特殊的”)。 prefetchNTA
根据Intel的优化手册可以绕过L2。
在核心上进行读取的预取应该有助于触发从其他核心写回到 L3,并传输到您自己的 L1D。但这只有在您要加载之前准备好地址时才有用。 (几十个循环才有用。)
英特尔 CPU 使用共享的包容性 L3 缓存作为片上缓存一致性的后盾。 2-socket 必须监听另一个 socket,但支持超过 2P 的 Xeons 有监听过滤器来跟踪移动的缓存行。
当你读到另一个核心最近写的一行时,它在你的 L1D 中总是无效的。 L3 是包含标签的,它的标签有额外的信息来跟踪哪个内核有线路。 (即使该行在某处的 L1D 中处于 M 状态也是如此,这要求它在 L3 中无效, according to normal MESI 。)因此,在您的缓存未命中检查 L3 标签后,它会触发对具有行将其写回 L3 缓存(并且可能将其直接发送到核心而不是想要它)。
Skylake-X (Skylake-AVX512) 没有包容性 L3(它有一个更大的私有(private) L2 和一个更小的 L3),但它仍然有一个标签包容性结构来跟踪哪个内核有一条线。它还使用网格而不是环,L3 延迟似乎明显比 Broadwell 差。
可能有用:使用直写缓存策略映射共享内存区域的延迟关键部分。 IDK 如果这个补丁曾经进入主线 Linux 内核,但请参阅 this patch from HP: Support Write-Through mapping on x86 。 (正常的政策是WB。)
还相关:Main Memory and Cache Performance ofIntel Sandy Bridge and AMD Bulldozer,深入了解 2 插槽 SnB 上的延迟和带宽,用于不同起始状态的缓存行。
有关 Intel CPU 内存带宽的更多信息,请参阅 Enhanced REP MOVSB for memcpy ,尤其是延迟限制平台部分。 (只有 10 个 LFB 限制了单核带宽)。
相关:What are the latency and throughput costs of producer-consumer sharing of a memory location between hyper-siblings versus non-hyper siblings? 有一些实验结果,让一个线程垃圾邮件写入一个位置,而另一个线程读取它。
请注意,缓存未命中本身并不是唯一的影响。您还会从执行负载的核心中的错误推测中获得很多 machine_clears.memory_ordering
。 (x86 的内存模型是强有序的,但真实的 CPU 推测性地提前加载并在极少数情况下中止,即缓存行在加载应该“发生”之前变得无效。
关于CPU缓存抑制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47097909/
我阅读了有关 JSR 107 缓存 (JCache) 的内容。 我很困惑:据我所知,每个 CPU 都管理其缓存内存(无需操作系统的任何帮助)。 那么,为什么我们需要 Java 缓存处理程序? (如果C
好吧,我是 jQuery 的新手。我一直在这里和那里搞乱一点点并习惯它。我终于明白了(它并不像某些人想象的那么难)。因此,鉴于此链接:http://jqueryui.com/sortable/#dis
我正在使用 Struts 2 和 Hibernate。我有一个简单的表,其中包含一个日期字段,用于存储有关何时发生特定操作的信息。这个日期值显示在我的 jsp 中。 我遇到的问题是hibernate更
我有点不确定这里发生了什么,但是我试图解释正在发生的事情,也许一旦我弄清楚我到底在问什么,就可能写一个更好的问题。 我刚刚安装了Varnish,对于我的请求时间来说似乎很棒。这是一个Magneto 2
解决 Project Euler 的问题后,我在论坛中发现了以下 Haskell 代码: fillRow115 minLength = cache where cache = ((map fill
我正试图找到一种方法来为我网络上的每台计算机缓存或存储某些 python 包。我看过以下解决方案: pypicache但它不再被积极开发,作者推荐 devpi,请参见此处:https://bitbuc
我想到的一个问题是可以从一开始就缓存网络套接字吗?在我的拓扑中,我在通过双 ISP 连接连接到互联网的 HAProxy 服务器后面有 2 个 Apache 服务器(带有 Google PageSpee
我很难说出不同缓存区域 (OS) 之间的区别。我想简要解释一下磁盘\缓冲区\交换\页面缓存。他们住在哪里?它们之间的主要区别是什么? 据我了解,页面缓存是主内存的一部分,用于存储从 I/O 设备获取的
1.题目 请你为最不经常使用(LFU)缓存算法设计并实现数据结构。 实现 LFUCache 类: LFUCache(int capacity) - 用数据结构的容量 capacity 初始化对象 in
1.题目 请你设计并实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。 实现 LRUCache 类: ① LRUCache(int capacity) 以正整数作为容量 capacity
我想在访问该 View 时关闭某些页面的缓存。它适用于简单查询模型对象的页面。 好像什么时候 'django.middleware.cache.FetchFromCacheMiddleware', 启
documents为 ExePackage element state Cache属性的目的是 Whether to cache the package. The default is "yes".
我知道 docker 用图层存储每个图像。如果我在一台开发服务器上有多个用户,并且每个人都在运行相同的 Dockerfile,但将镜像存储为 user1_myapp . user2 将其存储为 use
在 Codeigniter 中没有出现缓存问题几年后,我发现了一个问题。我在其他地方看到过该问题,但没有适合我的解决方案。 例如,如果我在 View 中更改一些纯 html 文本并上传新文件并按 F5
我在 Janusgraph 文档中阅读了有关 Janusgraph Cache 的内容。关于事务缓存,我几乎没有怀疑。我在我的应用程序中使用嵌入式 janusgrah 服务器。 如果我只对例如进行读取
我想知道是否有来自终端的任何命令可以用来匹配 Android Studio 中执行文件>使缓存无效/重新启动的使用。 谢谢! 最佳答案 According to a JetBrains employe
我想制作一个 python 装饰器来内存函数。例如,如果 @memoization_decorator def add(a, b, negative=False): print "Com
我经常在 jQuery 事件处理程序中使用 $(this) 并且从不缓存它。如果我愿意的话 var $this = $(this); 并且将使用变量而不是构造函数,我的代码会获得任何显着的额外性能吗?
是的,我要说实话,我不知道varnish vcl,我可以解决一些基本问题,但是我不太清楚,这就是为什么我遇到问题了。 我正在尝试通过http请求设置缓存禁止,但是该请求不能通过DNS而是通过 Varn
在 WP 站点上加载约 4000 个并发用户时遇到此问题。 这是我的配置: F5 负载均衡器 ---> Varnish 4,8 核,32 Gb RAM ---> 9 个后端,4 个核,每个 16 RA
我是一名优秀的程序员,十分优秀!