- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这个问题是关于同一个程序我previously asked about .回顾一下,我有一个具有如下循环结构的程序:
for (int i1 = 0; i1 < N; i1++)
for (int i2 = 0; i2 < N; i2++)
for (int i3 = 0; i3 < N; i3++)
for (int i4 = 0; i4 < N; i4++)
histogram[bin_index(i1, i2, i3, i4)] += 1;
bin_index
是其论点的完全确定性函数,就本问题而言,它不使用或更改任何共享状态——换句话说,它显然是可重入的。
n
运行外循环的所有迭代,其中
i1 % nthreads == n
.所以在每个线程中运行的函数看起来像
for (int i1 = n; i1 < N; i1 += nthreads)
for (int i2 = 0; i2 < N; i2++)
for (int i3 = 0; i3 < N; i3++)
for (int i4 = 0; i4 < N; i4++)
thread_local_histogram[bin_index(i1, i2, i3, i4)] += 1;
thread_local_histogram
s 最后在主线程中相加。
time
的典型输出(这是在 Linux 上)一个线程:
real 0m5.968s
user 0m5.856s
sys 0m0.064s
real 0m9.128s
user 0m10.129s
sys 0m6.576s
最佳答案
为避免对此进行进一步评论:当我写下我的回复时,提问者尚未发布指向其来源的链接,因此我无法针对他的具体问题调整我的回复。我只是在回答一般问题是什么“可以”导致这样的问题,我从未说过这必然适用于他的案件。当他发布指向他的来源的链接时,我写了另一个回复,这完全是针对他的问题(这是由于我在其他回复中解释的使用 random() 函数引起的)。但是,由于这篇文章的问题仍然是“当使用更多线程时,什么会使程序运行得更慢?”而不是“是什么让我的非常具体的应用程序运行得更慢?”,我认为也没有必要更改我相当笼统的回复(一般问题 -> 一般回复,具体问题 -> 特定回复)。
1) 缓存中毒
所有线程访问同一个数组,它是一块内存。每个内核都有自己的缓存来加速内存访问。由于它们不仅从数组中读取而且还更改内容,因此内容实际上仅在缓存中更改,而不是在实际内存中(至少不是立即更改)。问题是另一个内核上的另一个线程可能缓存了重叠的内存部分。如果现在核心 1 更改了缓存中的值,它必须告诉核心 2 该值刚刚更改。它通过使核心 2 上的缓存内容无效来实现,核心 2 需要从内存中重新读取数据,这会减慢处理速度。缓存中毒只能发生在多核或多 CPU 的机器上。如果您只有一个 CPU 和一个内核,这没问题。因此,要确定这是否是您的问题,只需禁用一个核心(大多数操作系统都允许您这样做)并重复测试。如果它现在几乎同样快,那就是你的问题。
2) 防止内存爆裂
如果以突发方式顺序读取内存,则读取速度最快,就像从 HD 读取文件一样。寻址内存中的某个点实际上非常慢(就像 HD 上的“搜索时间”一样),即使您的 PC 拥有市场上最好的内存。但是,一旦解决了这一点,顺序读取就会很快。第一次寻址通过发送行索引和列索引进行,并且在访问第一个数据之前总是有等待时间。一旦有了这些数据,CPU 就会开始爆发。当数据还在路上时,它已经发送了下一次突发的请求。只要它保持突发(通过始终发送“请下一行”请求),RAM 将继续尽可能快地输出数据(这实际上非常快!)。仅当数据按顺序读取且内存地址向上增长时,突发才有效(AFAIK 你不能从高地址突发到低地址)。如果现在两个线程同时运行并且都保持读/写内存,但是都来自完全不同的内存地址,每次线程 2 需要读/写数据时,它必须中断线程 1 的可能爆发,反之亦然.如果您有更多线程,这个问题会变得更糟,而且这个问题在只有一个单核 CPU 的系统上也是一个问题。
顺便说一句,运行比核心数更多的线程永远不会使您的进程更快(正如您提到的 3 个线程),它会减慢它的速度(线程上下文切换具有降低处理吞吐量的副作用)-这与您运行更多线程不同,因为某些线程在某些事件上处于休眠或阻塞状态,因此无法主动处理任何数据。在这种情况下,运行比核心数更多的线程可能是有意义的。
关于multithreading - 使用更多线程时,什么会使程序运行速度变慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/612860/
我在想出一个算法时遇到了麻烦... 我有一系列 GPS 数据,以 1 秒为间隔记录时间、速度、距离。假设距离是米,速度是米/秒。可能有超过 2 小时的数据,或 7200 个点。这里的“时间”字段主要是
使用java排序器,即: Collections.sort(myArrayList, new Comparator() { @Override public int c
有什么区别吗 SELECT * FROM my_table 和 SELECT my_column_id FROM my_table 地点: my_table 有百万行 网站上有大量并发用户进行sql查
有2个样本。 在第一个示例中,使用 orderby 可以更快地获得结果。 (根据 phpmyadmin 速度报告) 在另一个例子中,我没有使用 order by,它给出的结果较慢。 (根据 phpmy
我注意到,如果我将训练数据加载到内存中并将其作为 numpy 数组提供到图中,与使用相同大小的 shuffle 批次相比,速度会有很大差异,我的数据有大约 1000 个实例。 使用内存 1000 次迭
我在 python 中使用破折号。我正在绘制记录到 SQLite 数据库中的实时数据,目前,我正在绘制单个值与时间线图。我计划再添加 20 个图表,但目前,随着时间的增加, plotly 变慢,我认为
我试图调用 hasNext Velocity 模板中的方法,以便根据 foreach 循环中的位置影响行为 - 仅 hasNext没有按照文档工作。 这是 Velocity 用户指南的片段,关于 ha
在我正在制作的游戏中,我有两个点,pt1 和 pt2,我想计算出它们之间的角度。我已经在较早的计算中计算出距离。显而易见的方法是对垂直距离上的水平距离进行反正切 (tan(theta) = opp/a
我经常遇到字符串值不存在和/或为空的情况。这是测试这种情况的最佳方法吗? #if( $incentive.disclaimer && $!incentive.disclaimer != '' )
我想将一个模板nested包含在其他模板cont1,cont2和cont3中。 并且嵌套模板应仅对cont1隐藏一个特定控件。 在包含在cont1中之前,我想为一些标志变量$hideMyControl
是否可以更改从“Windows Azure Media Encoder”输出的音频的播放速度? 我正在使用配置为“WMA High Quality Audio”的“Windows Azure Medi
我使用速度将String(template)与字段合并 hi there I'am ${name}, And I'am ${age} old. velocity将字段${name}和${age}与一种
我使用的是 LockedBitmap 类,它简化了 C# 中位图数据的处理。目前它正在将数据复制到本地 byte[] 数组中,然后通过其类方法访问该数组以获取/设置像素颜色值。 这比直接通过指针访问锁
我尝试在 VM_global_library.vm 文件中添加一堆 #set($x=abc) 语句,但这些变量在我的 VM 模板中不可用。 我想为图像的基本路径等设置一个全局变量。这可能吗? 最佳答案
我的项目结构: -src --main ---java ----makers -----SomeClass ---resources ----htmlPattern.vm 如何告诉 SomeClass
我正在尝试从 Velocity 中的字符串中删除不需要的字符(换行符可以,但不能像 EM 和 CAN ASCII 控制字符那样)。 #set($cleanScreen = $cleanScreen.r
我想在日.月.年之间的点处分割日期。例如:2015 年 1 月 14 日至 {14, 01, 2015}这是我使用的代码:dates3.get(0) 包含我从页面的文本字段获取的字符串“14.01.2
之后,从 1.5 升级到速度引擎 1.7 出现了 1.5 没有的问题。为了解释这个问题,我必须展示一个代码片段: #foreach($someVariable in $someCollection)
我想知道从表中选择所有字段是否更快: SELECT * 或只选择您真正需要的: SELECT field1, field2, field3, field4, field5... 假设表有大约 10 个
我正在尝试模仿照片应用程序的行为,在该应用程序中,用户用手指平移照片并且照片具有一定的速度。由于我不会深入的原因,我不能将 UIScrollView 与它的缩放 UIImageView 一起使用,而是
我是一名优秀的程序员,十分优秀!