gpt4 book ai didi

memset 可以在 4 核上并行化吗?

转载 作者:可可西里 更新时间:2023-11-01 13:27:09 25 4
gpt4 key购买 nike

我不确定。我可以在四个内核上编写一个大的内存集(例如 10 MB)来获得加速吗?

这种 ram-chip 并行化是否可能,以及触发其他线程的时间成本有多大 - 是超过一毫秒还是更短?

最佳答案

你指出了一个正确的问题,同时很难给出一个简单的答案。这涉及到几个方面。

  1. 启动新线程(或从某些缓存中挑选它们)的开销;
  2. 内存总线上的争用。
  3. 上述方面各不相同,不同平台的成本也大不相同。

更大的 PC 有多个内存总线。较小的只有一个。在单内存总线系统上,这没有任何意义。如果您的系统有多个内存总线( channel ),您的数据数组可能会在内存条之间任意分割。如果整个数组都位于同一个内存库中,那么并行化将毫无用处。弄清楚阵列的布局又是一项开销。换句话说,在拆分核心之间的操作之前,有必要弄清楚这是否值得做。

简单的答案是,这些难以预测的开销很可能会消耗 yield 并使整体结果变得更糟。

同时对于某些体系结构上非常大的内存区域来说这是有意义的。

关于memset 可以在 4 核上并行化吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12852940/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com