- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个应用程序,它有 2 个线程,线程 A 与核心 1 的关联性和线程 B 与核心 2 的关联性,
核心 1 和核心 2 在同一个 x86 插槽中。
线程 A 忙于整数 x 的自旋,线程 B 在某些情况下会增加 x,当线程 B 决定增加 x 时,它会使 x 所在的缓存行失效,并根据 x86 MESI 协议(protocol)存储新的 x 存储缓冲区在 core2 接收到无效 ack 之前,然后在 core2 接收到无效 ack 之后,core2 刷新存储缓冲区。
我想知道,core2 收到无效确认后是否立即刷新存储缓冲区?!有没有机会我可以强制 cpu 用 c 语言刷新存储缓冲区?!因为在我的情况下,core1 spining x 中的线程 A 应该尽早获得 x 新值。
最佳答案
核心总是尽可能快地将其存储缓冲区提交到 L1d 缓存(因此变得全局可见),以便为更多存储腾出空间。
您可以使用屏障(如 atomic_thread_fence(memory_order_seq_cst
)使线程等待其存储在进行任何更多加载或存储之前变为全局可见,但这通过阻塞该核心而不是通过加速刷新存储缓冲区来工作。
显然,为了避免 C11 中未定义的行为,变量必须是 _Atomic
.如果只有一位作者,您可以使用 tmp = atomic_load_explicit(&x, memory_order_relaxed)
和 tmp+1
的 store_explicit以避免更昂贵的 seq_cst 存储或原子 RMW。 acq/rel 排序也可以,只是避免使用默认的 seq_cst,并避免使用 atomic_fetch_add
如果只有一位作家,RMW。
如果只有一个线程修改它,而其他线程以只读方式访问它,则不需要整个 RMW 操作是原子的。
在另一个核心可以读取您写入的数据之前,它必须从将其写入 L3 缓存的核心的 L1d 中的修改状态,然后从那里到达读取器核心的 L1d。
您也许可以加快这部分的速度,这发生在数据离开存储缓冲区之后。但是你能做的有用的不多。你不想 clflush
/clflushopt
,这将完全回写+逐出缓存行,因此如果其他内核在此过程中没有尝试读取它(如果可能的话),则必须从DRAM中获取它。
冰湖有 clwb
这(希望)将数据缓存并强制写回DRAM。但这再次迫使数据实际上一直传输到 DRAM,而不仅仅是共享的外部缓存,因此它会消耗 DRAM 带宽并且可能比我们想要的要慢。 (Skylake-Xeon 也有,但是 handles it the same as clflushopt
。我期待并希望 Ice Lake 客户端/服务器有/将有一个正确的实现。)
Tremont (successor to Goldmont Plus , atom/silvermont系列 ) 有 _mm_cldemote
( cldemote
)。这与 SW 预取相反;将缓存线写入 L3 是可选的性能提示,但不会强制它进入 DRAM 或其他任何东西。
如果没有特殊说明,也许您可以写入在 L2 和 L1d 缓存中别名相同集合的 8 个其他位置,从而强制冲突驱逐 .这将在写入线程中花费额外的时间,但可以使数据更快地提供给其他想要读取它的线程。我没试过这个。
这也可能会驱逐其他线路,花费更多的 L3 流量 = 系统范围的共享资源,而不仅仅是在生产者线程中花费时间。您只会考虑延迟,而不是吞吐量,除非其他行是您想要编写和驱逐的行。
关于c - 如何强制 cpu 核心刷新 c 中的存储缓冲区?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54067605/
Linux 有许多跨(假设是 2 个)CPU 内核执行的线程和进程。我希望我的单线程 C/C++ 应用程序成为 CPU0 上的唯一线程。我如何“移动”所有其他线程以使用 CPU1? 我知道我可以使用
我有一个类似于下图的数据库表 Table with 2 columns (UserId and value) 我将传递 UserId 和 2 个字符串。例如:userId: 1, key1: h1,
我想在我的新项目中使用 ASP.NET Core,因为我听说它更快。但是,该项目将使用广泛的数据库访问功能,Entity Framework Core 不支持其中一些功能。我想知道,是否可以使用 En
我已经使用 EntityFrameworkCore.SqlServer 2.0 开发了 asp .net core wep api 2.0 应用程序。它是使用数据库优先方法开发的。当尝试使用 dbco
我已经阅读了很多关于这个主题的文章,但我仍然无法处理这个问题。对不起,如果它是重复的,无论如何! 所以基本上,我正在从头开始构建一个 Angular 应用程序,并且我想按照最佳约定来组织我的代码。我有
我对MPI还是陌生的,所以如果这是一个琐碎的问题,请原谅我。我有一个四核CPU。我想运行一个在单个内核上使用两个进程的OpenMPI C++程序。有什么办法吗?如果是这样,那又如何?我提到了this
下面是一个传播异常处理机制的类问题,所需的输出是异常。任何人都可以解释为什么输出是异常,在此先感谢。 Class Question { public void m1() throws Excep
我想打印每个获得 CPU 时间片的进程的 name 和 pid。可能吗? 最佳答案 对于单个流程,您可以在以下位置获取此信息: /proc//stat 第14和第15个字段分别代表在用户态和内核态花费
我想知道是否可以识别具有特定 thread-id 的线程使用的物理处理器(核心)? 例如,我有一个多线程应用程序,它有两 (2) 个线程(例如,thread-id = 10 和 thread-id =
我有一个需要身份验证的 Solr 核心。假设我有一个用户,密码为password。当我现在尝试在控制台中创建一个 Solr 核心时 bin\solr create -c test 我收到 HTTP 错
我想为与使用它的项目不同的类库中的第二个和后续数据库创建迁移。有皱纹。我永远不会知道连接字符串,直到用户登录并且我可以从目录数据库 (saas) 中获取它。 对于目录数据库,我使用了来自 this 的
我想为一种可以产生 GHC Core 的简单语言创建一个前端。然后我想获取这个输出并通过正常的 GHC 管道运行它。根据this page , 不能直接通过 ghc 命令实现。我想知道是否有任何方法可
阅读文档,我构建了 2 个使用 BLE 连接 2 个 iDevices 的应用程序。 一个设备是中央设备,另一个是外围设备。 Central在寻找Peripheral,当找到它时,探索它的服务和特性,
在我的网络应用程序中,我对长时间运行的任务进行了操作,我想在后台调用此任务。因此,根据文档 .net core 3.1 Queued background tasks我为此使用这样的代码: publi
Solr 1.4 Enterprise Search Server 建议对核心副本进行大量更新,然后将其换成主核心。我正在按照以下步骤操作: 创建准备核心:http://localhost:8983/
它们是否存在,如果存在,文档和代码在哪里? 最佳答案 它们位于 Git 的 test 目录中。 https://github.com/jquery/jquery/tree/master/test 关于
我有一个 Lisp (SBCL 1.0.40.0.debian) 应用程序 (myfitnessdata),它使用以下代码来处理命令行参数: (:use :common-lisp) (:export
Core是GHC的中间语言。阅读Core可以帮助你更好地了解程序的性能。有人向我索要有关阅读 Core 的文档或教程,但我找不到太多。 有哪些文档可用于阅读 GHC Core? 这是我迄今为止发现的内
我有一个核心 WebJob 部署到 Azure Web 应用程序中。我正在使用WebJobs version 3.0.6 . 我注意到,WebJob 代码不会立即拾取对连接字符串和应用程序设置的更改(
我有一个在内部构造和使用 SqlConnection 类的第三方库。我可以从该类继承,但它有大量重载,到目前为止我一直无法找到合适的重载。我想要的是将参数附加到正在使用的连接字符串。 有没有办法在 .
我是一名优秀的程序员,十分优秀!