- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在这里,我将重点关注我遇到降级的自定义应用程序(不需要对线程与进程的快速性进行一般性讨论)。
我有 Java 上的 MPI 应用程序,它使用迭代方法解决了一些问题。下面的应用程序示意图让我们将其称为 MyProcess(n),其中“n”是进程数:
double[] myArray = new double[M*K];
for(int iter = 0;iter<iterationCount;++iter)
{
//some communication between processes
//main loop
for(M)
for(K)
{
//linear sequence of arithmetical instructions
}
//some communication between processes
}
为了提高性能,我决定使用 Java 线程(我们称之为 MyThreads(n))。代码几乎相同 - myArray 变成矩阵,其中每行包含适当线程的数组。
double[][] myArray = new double[threadNumber][M*K];
public void run()
{
for(int iter = 0;iter<iterationCount;++iter)
{
//some synchronization primitives
//main loop
for(M)
for(K)
{
//linear sequence of arithmetical instructions
counter++;
}
// some synchronization primitives
}
}
使用 Executors.newFixedThreadPool(threadNumber) 创建并启动线程。
问题是,虽然对于 MyProcess(n),我们获得了足够的性能(n 在 [1,8] 中),但在 MyThreads(n) 的情况下,性能本质上会下降(在我的系统上,性能下降了 n 倍)。
硬件:Intel(R) Xeon(R) CPU X5355(2个处理器,每个4核)
Java 版本:1.5(使用 d32 选项)。
起初我以为线程上有不同的工作负载,但事实并非如此,变量“counter”显示,MyThreads(n) 的不同运行之间的迭代次数([1,8] 中的 n)是相同的。
这不是同步错误,因为我已经临时注释了所有同步原语。
任何建议/想法将不胜感激。
谢谢。
最佳答案
我在您的代码中发现两个问题。
<小时/>首先是缓存问题。由于您尝试在多线程/进程中执行此操作,因此我假设您的 M * K 结果会很大;然后当你这样做时
double[][] myArray = new double[threadNumber][M*K];
您实际上是在创建一个大小为 threadNumber 的双指针数组;每个都指向大小为 M*K 的 double 组。这里有趣的一点是,数组的 threadNumber 计数不一定分配到同一内存块上。它们只是双指针,可以分配在 JVM 堆内的任何位置。因此,当多个线程运行时,您可能会遇到大量缓存未命中,并且最终会多次读取内存,最终减慢程序速度。
如果以上是根本原因,您可以尝试增大 JVM 堆大小,然后执行
double[] myArray = new double[threadNumber * M * K];
并且让线程在同一数组的不同段上运行。您应该能够更好地看到性能。
<小时/>其次是同步问题。请注意, double (或任何原始)数组不是 volatile 的。因此,不能保证 1 个线程上的结果对其他线程可见。如果您使用同步块(synchronized block),这可以解决问题,因为同步的副作用是确保跨线程的可见性;如果没有,当您读写数组时,请务必使用Unsafe.putXXXVolatile()和Unsafe.getXXXVolatile(),以便您可以对数组进行 volatile 操作。
更进一步,Unsafe 还可以用于创建连续的内存段,您可以用它来保存数据结构并实现更好的性能。在你的情况下,我认为 1) 已经成功了。
关于java线程与java进程性能下降,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6899891/
我想循环遍历 gpx 文件并计算总上升和下降。我有一个函数可以计算两组经纬度点之间的高程差异,我已经设置了 simplexml 来读取和循环遍历 gpx 文件 trkseg 点。 问题是,这不准确(实
我有两个在不同时间段拍摄的数组。如何通过将新玩家标记为上升来检查哪些玩家在列表中上升/下降? 附言- 数组已经根据分数排序。 pastData:[ { playerName:'Jo
我想捕获 ctrl/alt/etc 键的起伏,无论表单上的哪个控件获取 keyup 或 keydown 事件。由于我的表单上有大约 100 个控件,如果我要为每个单独的控件添加代码,那将非常难看。我怎
vector1 = c(2, 2, 2, 2, 2, 2) vector2 = c(2, 2, 3, 3, 3, 3) vector3 = c(2, 2, 1, 2, 2, 2) 我想知道向量中的数字
我不知道如何遵循编译器的建议:consider using a let binding to create a longer lived value。 Playground #![allow(unus
我希望有人能帮助我理解 AngularJS 中的 $scope 遇到的一个恼人的问题。请参阅下面我的代码中的注释: app.controller('MyController', function ($
我有一个 flex 搜索集群,其中有2个节点在2核CPU 8GB ram实例上运行。每个节点都传入了参数“ES_JAVA_OPTS = -Xms3g -Xmx3g”。我有4个索引,每个索引有2个分片和
我正在学习 R(及其通过 quantmod lib 在交易任务中的应用)并定期浏览社区以从这里获得许多新知识和技巧。我对 R 的总体印象和特别是 quantmod lib 的印象 - 它很棒。 在这一
当我们点击屏幕时,我正在绘制纹理正方形。我正在使用相同的纹理。在新 ios 设备中点击几次后,FPS 从 120 下降到 4 左右。每次手指点击时,我都会将点击的点以及纹理和纹理的大小传递给着色器。
只有当对象被点击并且需要从列表中移除时它才会掉落。这是代码: if(event.type == TouchEvent.TOUCH_DOWN){ for(Bottle bottl
我有一个基于SpriteKit的小游戏。 在这个游戏中,我使用了很多带有字母(或字母组合)的节点,用户可以四处移动来构建单词。 这些节点基本上是带有 SKLabelNode 的 SKSpriteNod
我有一个简单的CSS布局 wrapper header left-sidebar / main-content / right-sidebar footer 但我的主要内容似乎下降了(float dr
在标题中,我给出了四个不同的部分,并使用 float 属性使所有内容都显示在一条水平线上。 当我调整浏览器窗口大小时,最后一个 div 位于黑色边框线下方。 如何解决。 http://jsfiddle
CSS: .desc{ text-align: center; color:#60A8D5; padding-top: 17px;
这是一段简单的代码,但我为这个问题尝试过的解决方案都没有奏效。 #ONE { float: left; border: 1
我有一个 SceneKit 设置,其中有一个 Sphere 设置为 Dynamic body。 我能够运行该应用程序并看到球体落在静态 body 地板上。 我想做的是设置场景,这样 sfere 最初就
首先,我的类(class): export class FooBar { ... isFavorite: boolean = false; constructor() { this.isF
我正在尝试删除所有端口上的所有传出 RST 和传入 RST。我正在使用 Debian Linux。我尝试了互联网上列出的所有可能的命令组合,但似乎没有任何效果。 例如,我试过: iptables -A
我正在做这样的事情: fn main() { //[1, 0, 0, 0, 99]; // return [2, 0, 0, 0, 99] //[2, 3, 0, 3, 99]; //
我正在使用 Rusqlite,它可以让你做这样的查询: statement.query_row(params!([1, 2, 3]), ...); params!()定义如下: macro_rules
我是一名优秀的程序员,十分优秀!