- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这个问题是关于同一个程序我previously asked about .回顾一下,我有一个具有如下循环结构的程序:
for (int i1 = 0; i1 < N; i1++)
for (int i2 = 0; i2 < N; i2++)
for (int i3 = 0; i3 < N; i3++)
for (int i4 = 0; i4 < N; i4++)
histogram[bin_index(i1, i2, i3, i4)] += 1;
bin_index
是其论点的完全确定性函数,就本问题而言,它不使用或更改任何共享状态——换句话说,它显然是可重入的。
n
运行外循环的所有迭代,其中
i1 % nthreads == n
.所以在每个线程中运行的函数看起来像
for (int i1 = n; i1 < N; i1 += nthreads)
for (int i2 = 0; i2 < N; i2++)
for (int i3 = 0; i3 < N; i3++)
for (int i4 = 0; i4 < N; i4++)
thread_local_histogram[bin_index(i1, i2, i3, i4)] += 1;
thread_local_histogram
s 最后在主线程中相加。
time
的典型输出(这是在 Linux 上)一个线程:
real 0m5.968s
user 0m5.856s
sys 0m0.064s
real 0m9.128s
user 0m10.129s
sys 0m6.576s
最佳答案
为避免对此进行进一步评论:当我写下我的回复时,提问者尚未发布指向其来源的链接,因此我无法针对他的具体问题调整我的回复。我只是在回答一般问题是什么“可以”导致这样的问题,我从未说过这必然适用于他的案件。当他发布指向他的来源的链接时,我写了另一个回复,这完全是针对他的问题(这是由于我在其他回复中解释的使用 random() 函数引起的)。但是,由于这篇文章的问题仍然是“当使用更多线程时,什么会使程序运行得更慢?”而不是“是什么让我的非常具体的应用程序运行得更慢?”,我认为也没有必要更改我相当笼统的回复(一般问题 -> 一般回复,具体问题 -> 特定回复)。
1) 缓存中毒
所有线程访问同一个数组,它是一块内存。每个内核都有自己的缓存来加速内存访问。由于它们不仅从数组中读取而且还更改内容,因此内容实际上仅在缓存中更改,而不是在实际内存中(至少不是立即更改)。问题是另一个内核上的另一个线程可能缓存了重叠的内存部分。如果现在核心 1 更改了缓存中的值,它必须告诉核心 2 该值刚刚更改。它通过使核心 2 上的缓存内容无效来实现,核心 2 需要从内存中重新读取数据,这会减慢处理速度。缓存中毒只能发生在多核或多 CPU 的机器上。如果您只有一个 CPU 和一个内核,这没问题。因此,要确定这是否是您的问题,只需禁用一个核心(大多数操作系统都允许您这样做)并重复测试。如果它现在几乎同样快,那就是你的问题。
2) 防止内存爆裂
如果以突发方式顺序读取内存,则读取速度最快,就像从 HD 读取文件一样。寻址内存中的某个点实际上非常慢(就像 HD 上的“搜索时间”一样),即使您的 PC 拥有市场上最好的内存。但是,一旦解决了这一点,顺序读取就会很快。第一次寻址通过发送行索引和列索引进行,并且在访问第一个数据之前总是有等待时间。一旦有了这些数据,CPU 就会开始爆发。当数据还在路上时,它已经发送了下一次突发的请求。只要它保持突发(通过始终发送“请下一行”请求),RAM 将继续尽可能快地输出数据(这实际上非常快!)。仅当数据按顺序读取且内存地址向上增长时,突发才有效(AFAIK 你不能从高地址突发到低地址)。如果现在两个线程同时运行并且都保持读/写内存,但是都来自完全不同的内存地址,每次线程 2 需要读/写数据时,它必须中断线程 1 的可能爆发,反之亦然.如果您有更多线程,这个问题会变得更糟,而且这个问题在只有一个单核 CPU 的系统上也是一个问题。
顺便说一句,运行比核心数更多的线程永远不会使您的进程更快(正如您提到的 3 个线程),它会减慢它的速度(线程上下文切换具有降低处理吞吐量的副作用)-这与您运行更多线程不同,因为某些线程在某些事件上处于休眠或阻塞状态,因此无法主动处理任何数据。在这种情况下,运行比核心数更多的线程可能是有意义的。
关于multithreading - 使用更多线程时,什么会使程序运行速度变慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/612860/
我有2个功能: function func1() while true do -- listen on connection end end function func2()
我的问题可能看起来很奇怪,但我想我正面临着 volatile 的问题。对象。 我写了一个这样实现的库(只是一个方案,不是真正的内容): (def var1 (volatile! nil)) (def
由于 maven 支持多线程构建,是否可以同时运行 Sonar 多线程? (例如 mvn sonar:sonar -T 4 ) 我运行了它,当模块报告成功时,它报告整个构建失败并返回 java.uti
我们正在启动一个网站,该网站在短时间内的交易量非常大。它基本上是在给票。该代码是用Java,Spring和Hibernate编写的。我想通过产生多个线程并尝试使用JUnit测试用例来获取票证来模仿高容
我正在尝试访问像素数据并将图像从游戏中的相机保存到磁盘。最初,简单的方法是使用渲染目标,然后使用RenderTarget-> ReadPixels(),但是由于ReadPixels()的 native
我们有以下系统: 用户数:〜500k 项目数:〜100k UserSimilarity userSimilarity = new TanimotoCoefficientSimilarity(dataM
也许这是一个经常出现的问题,但我需要根据我的上下文进行一些自定义。 我正在使用 Spring Batch 3.0.1.RELEASE 我有一个简单的工作,有一些步骤。一个步骤是这样的 block :
也许这是一个经常出现的问题,但我需要根据我的上下文进行一些自定义。 我正在使用 Spring Batch 3.0.1.RELEASE 我有一个简单的工作,有一些步骤。一个步骤是这样的 block :
我正在尝试使用PyBrain和Python的multiprocessing软件包在Python中训练神经网络。 这是我的代码(它训练了一个简单的神经网络来学习XOR逻辑)。 import pybrai
我有一个繁重的功能,不适合在主时间轴上执行(因为要花很长时间才能完成并使程序崩溃)。 因此我在air(as3)中搜索多线程,但是我发现的所有示例都说明了如何在worker中运行单独的swf文件。如何在
我想实现线程A 和线程B 并行运行并共享全局变量。 下面是用python编写的代码。我想在中执行相同操作Dart (我不想使用future等待,因为它正在等待其他线程完成或必须等待。) 大小写变量:
我的一个项目只适用于调试 DLL,而不适用于非调试 DLL。 在 Debug DLL 设置下发布项目有哪些注意事项?例如,是否丢失了某些优化? 如何通过将调试版本设置为非调试 DLL 来调试此项目?我
我正在尝试比较 Matlab 和 Julia 之间的速度和性能。我正在查看一个代码,该代码对承受给定负载的连续体结构进行拓扑优化。我正在查看的代码是公共(public)代码topopt88.m:htt
Serving Flask 应用程序“服务器”(延迟加载) 环境:生产警告:这是一个开发服务器。不要在生产部署中使用它。请改用生产 WSGI 服务器。 Debug模式:开启 在 http://0.0.
我对 PyQT 很陌生。我正在学习如何制作 Progressbar 并随着算法的进展对其进行更新。我已经能够制作一个使用此链接进行 self 更新的基本进度条:Python pyqt pulsing
我正在尝试指定在特定线程上运行任务,这样我就可以使用两个专用于“放入” channel 的耗时任务的线程,而其他线程则用于处理该任务。 我对如何将特定任务分配给特定线程感到困惑。我以为我可以使用类似
我正在编写一个软件,它对很多(潜在的大)图像进行大量图像操作/合成。 多线程有助于提高速度,但 QT 不允许同时在同一图像上使用多个 QPainter。 所以我必须在副本的每个线程中进行图像操作/合成
此脚本读取 url 文件以执行多线程 HTTP 请求。 如何使用带有 url 的数组来发出多线程请求? 我的阵列将有类似的东西: @array = ("https://example.com/xsd"
Java 文档声明了以下关于构造函数同步的内容: Note that constructors cannot be synchronized — using the synchronized keyw
我有一个程序,其中主线程创建了很多线程。它崩溃了,我正在调试核心文件。崩溃发生在其中一个子线程中。为了找到原因,我需要知道主线程是否还活着。有什么方法可以找出哪个线程是初始线程? 最佳答案 Is th
我是一名优秀的程序员,十分优秀!