- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我有一个关于 java 并发软件的问题要问你。
我的应用程序的主要算法必须将 A
矩阵分解为 LU
矩阵:A = LU。此处粘贴的分解方法进行了高斯-若尔当归约。该软件设计用于处理位置为 A[0][0] != 0
的方阵。
不幸的是,为了算法的正确工作,我必须等待每一行都实现值。
我尝试使用障碍使该算法并行(等待每一行的实现并增加 "rigaCorrente" 值)但即使在并行中我也没有获得真正的加速版本我的处理器(2.4 GHz Core 2 Duo P8600)以总功率的 80%(而不是串行处理器的 40-50%)工作。
我担心的是我遇到了虚假分享的情况。问题与虚假分享有关,还是与其他事情有关?我知道 JVM 执行了很好的优化,但它仍然使用处理器的一半功率。我不认为改进算法是不可能的!
我的序列号代码:
public void decompose(){
int n = A.length;
for(int k=0; k<n-1;k++) {
for(int i=k+1; i<n; i++) {
A[i][k] = A[i][k]/A[k][k];
for(int j=k+1; j<n; j++) {
A[i][j] = A[i][j] - A[i][k] * A[k][j];
}
}
}
decomposed = true;
}
我的并行代码:
public class Manager {
private double [][] A;
private Semaphore main = new Semaphore(0);
private CyclicBarrier barriera;
private AtomicInteger index;
private int rigaCorrente = 0;
private boolean stop = false;
public Manager(final double A[][], final int numThr){
this.A = A;
this.index = new AtomicInteger(1);
barriera = new CyclicBarrier(numThr, new Runnable(){
@Override
public void run() {
rigaCorrente++;
index = new AtomicInteger(rigaCorrente+1);
if(rigaCorrente == A.length - 1){
setStop(true);
main.release();
}
}
});
}
线程类:
public class Deco implements Runnable {
private Manager manager;
public Deco(Manager manager){
this.manager = manager;
}
@Override
public void run() {
double [][] A = manager.getA();
while(manager.getStop() == false){
int i;
while((i = (manager.getIndex().getAndIncrement())) < (A.length)){
double pivot = A[i][manager.getRigaCorrente()]/A[manager.getRigaCorrente()] [manager.getRigaCorrente()];
for(int k = manager.getRigaCorrente(); k<A.length; k++)
A[i][k] = A[i][k] - (pivot*A[manager.getRigaCorrente()][k]);
A[i][manager.getRigaCorrente()] = pivot;
}
manager.acquireBarriera();
}// Stop
}
}
主要用于并行代码:
package luConcurrent.test;
import java.util.Arrays;
import java.util.Scanner;
import lu.DecompositionLU;
import lu.IO;
public class Starter {
private static IO io;
private static DecompositionLU dec;
public static void main(String[] args) throws Exception {
io = new IO("//Users//black//Desktop//serie//2500.txt");
int numThr = 2;
double [][] A = io.readMatrixFromInputFile();
double [] b = io.readArrayFromInputFile();
double [] x;
dec = new DecompositionLU(A);
System.out.println("A.length: "+A.length);
Manager manager = new Manager(A,numThr);
Thread[] pool = new Thread[numThr];
for(int i=0; i<pool.length; i++){
pool[i] = new Thread(new Deco(manager));
}
long inizio = System.nanoTime();
for(int i = 0; i<pool.length; i++){
pool[i].start();
}
manager.getMain().acquire();
dec.ProgresiveSustitution(b);
x = dec.RegresiveSustitution(b);
long fine = System.nanoTime()-inizio;
System.out.println("Solution is: "+Arrays.toString(x));
Scanner sc = new Scanner(System.in);
sc.nextLine();
System.out.println("Tempo: "+fine);
sc.close();
}
}
结果:
1000x1000 Serial: 1154679000 nanoSec
1000x1000 Parallel 2 Threads: 1135663000 nanoSec
1750x1750 Serial: 7502559000 nanoSec
1750x1750 Parallel 2 Threads: 6667129000 nanoSec
4000x4000 Serial: 89851311000 nanoSec
4000x4000 Parallel 2 Threads: 84348616000 nanoSec
最佳答案
我不会仓促得出错误共享正在发生的结论。该算法的并行版本增加了大量开销,这可能是导致其性能低于您预期的原因。
串行版本只有三个嵌套循环:k
上的外循环、i
上的中间循环和 j
上的内循环>。它所做的只是数组访问和算术运算,所以这应该非常快。
并行版本在每次迭代时使用 CyclicBarrier
在 rigaCorrente
(当前行,如果我没记错的话)上运行其外循环。这增加了开销。循环屏障导致早到的线程等待,直到最后一个到达。好吧,你只有两个线程,所以第一个到达的线程必须等待第二个。那是一些死时间。即使线程大约同时完成,执行屏障同步也会产生开销。然后一个线程必须等待,而另一个线程运行屏障操作。
中间循环结束于 index
,它是 getIndex
方法调用获取的 AtomicInteger
。方法调用增加了开销,getAndIncrement
在线程之间增加了一些争用。
内部循环(令人困惑的是 k
而不是串行版本中的 j
)在其中调用了 getRigaCorrente
方法。有时——但只是有时——JVM 可以内联方法调用。我在这里没有看到 getRigaCorrente
的实现,但是由于 rigaCorrente
是 manager
的私有(private)实例变量,它不是易变的,而且它是多线程读写,也许这个方法是同步的。这会增加更多开销。
这里的问题是线程在运行期间必须与共享状态交互很多。这增加了开销和争用。我建议尝试找到一种方法来提前在线程之间划分工作,然后告诉每个线程它需要做什么工作,然后让它们都独立运行。
关于Java Concurrent - 没有 speedUp 获得 LU 算法 - 虚假共享?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20351792/
只是想知道是否有可能找出谁从 Windows 共享中读取了文件(最好使用 .NET,但 win32 native 可以)? 我想做的是创建类似 awstats 的东西对于 Windows 共享,这样我
是否可以列出 Intent.ACTION_SEND ?我的意思是我需要知道是否有人通过 action_send 在 Facebook 上分享或在 Twitter 上发推文。 最佳答案 也许你想要一个更
我正在使用 Google Apps 应用程序。实际上,我想在不使用密码的情况下访问另一个 ID。我使用了 OAuth,它运行良好。但我无法分享特定人的日历。我尝试了以下代码。 GoogleOAuthP
我怎样才能只创建模拟器...可能吗?我知道,设备需要分发证书。 最佳答案 您只需将应用程序目录从 iPhone 模拟器复制到另一个实例/操作系统版本,它就应该可以工作。 因此,如果您想分发 3.1.3
我想使用多阶段构建来避免每次构建应用程序时都下载我的 Java 项目所需的所有 Maven 依赖项。 我正在考虑在第一阶段解决 Maven 依赖项,然后在第二阶段构建应用程序,这将需要访问在前一阶段下
我正在寻找保护用户下载内容的初步想法。用户下载充满有趣资源的 zip 文件,这些资源被提取到本地文件系统中以供应用程序使用。我的目标是防止用户通过互联网将下载的资源共享给其他用户(假设他们获得了对文件
我想知道在具有移动和桌面版本的网站上共享身份验证、 session 管理等的最佳方法是什么。我们正在运行 Tomcat,并且更愿意将移动站点和桌面站点的应用程序保持在不同的节点上。 我看过类似的帖子,
我发现了这个单例的实现。我怎样才能创建指向它的指针或共享指针?` 为什么这不起作用?自动测试 = Singleton::Instance(); class Singleton { public: st
我有一个 heroku 项目,我想与其他人分享。作为the instructions describe ,我使用 virtualenv 来管理环境和依赖项。有没有办法在新机器上从 requiremen
Maven 将所有 jar 存储在本地存储库 ~/.m2/repository/ 下。用户多时占用空间大。 那么,是否可以由多个用户共享这个本地存储库,或许在不同的目录结构下? 最佳答案 简单的回答
为什么共享 worker 在重新加载页面时死了?应该是复活了我该如何解决这个问题? 重装前 重新加载后(在example.com上按F5) parent worker var port = new S
我正在开发多个小型应用程序,这些应用程序将共享通用和共享模块和 Assets 。 关于如何创建项目结构的部分在这里回答:https://stackoverflow.com/a/61254557/135
我在 RHEL 上安装了 jenkins (localhost:8080),我能够成功地构建代码 现在,我想设置主/从代理。 我的笔记本电脑将充当“Master Jenkins”,而我同事的笔记本电脑
我有这种方法可以根据我使用的 EXTRA_STREAM 共享文本文件或图片。我有这两个我可以选择 i.putExtra(Intent.EXTRA_STREAM, uri); i.putExtra(In
我正在使用 R 中的一个数据分析项目,我正在使用 R 中的敏感私有(private)数据进行一些逻辑和多级建模。我爱上了 。预订 包,我已经创建了一本关于我们的工作流程和分析管道的相当广泛的书。问题是
我正在构建的应用程序需要在 UITabBarController 框架内为多个 View (及其 subview )显示共享的自定义 UIToolbar。自定义工具栏的内容在所有 View 中都是相同
我有多个应用程序,我想共享相同的 eslint 配置: - project_root/ - app1/ - node_modules/ - eslint.rc
我有多个 Electron 应用程序。一个是主应用程序,其他几个功能应用程序。主应用程序上的按钮很少,这将导致功能应用程序打开。这里的问题是每个应用程序都有一个主进程,该进程导致要利用更多的CPU。是
我正在开发一个 Node.js 后端,它通过 websocket 与一些桌面客户端进行通信,而服务器端的通信是从 Web 前端发起的。一切正常,因为我将 SockJS Connection 实例存储在
我对托管多个网站的服务器上的多个用户帐户使用私有(private) SSH key 和无密码条目。 我为每个用户帐户使用相同的私钥。 (因为我很懒?或者那是“正确”的方式)。 我现在想授权该国不同地区
我是一名优秀的程序员,十分优秀!