- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
编辑:“Z Boson”、“Chiron”和“Mattias F”给出的答案可能正是我所需要的。但是,我不知道 OPENMP 和 JNI 所需要的任何 C 或 C++。 OpenCL 确实有可用的现有第三方 Java API,但我不知道 GPU 的效率如何满足我的需求。我在这里找到了一个有趣的解决方案:Parallelizing a for loop ,但这会减少我的计算时间几个小时吗?
我最终将实现 C++ 方法,但现在我需要一个快速修复。还有其他建议吗?
<小时/>我遇到一个问题,我需要对 n 个元素的所有 2^n 组合迭代一系列操作,其代码可以在这里找到:https://stackoverflow.com/questions/26577172/brute-force-optimally-deleting-2s-from-a-random-matrix-how-can-i-make-it-fas .
在我弄清楚随机矩阵背后的数学原理之前,我希望尽可能地优化当前流程,因为即使在通过命令行将 Java JVM(热点)配置为高吞吐量之后,遍历 n = 24 也需要几个小时。因此,如果我要在所有四个 CPU 核心上实现多处理/并行计算,这会大大缩短完成时间吗?
我问这个问题是因为我对多处理/线程及其实现一无所知,而且我只是在学习 Java 入门类(class)的第一学期。如果不明智的话,我不想浪费时间学习这个。具体来说,在这种情况下(根据我迄今为止在 S.O. 上读到的内容),我将提交至少“n”批作业,其中每个批最多包含 n 中某些 x 的“x < n”元素的所有组合。建议?
最佳答案
我建议使用JNI和OPENMP来构建一个简单的并行环境,因为VM机制无论如何都比不上 native 代码速度(如 C/C++)。
JNI 是一个 Java 功能,它使您能够在 Java 中调用 C 过程。
openmp(omp) 是一个 C/C++ 库,它使并行计算变得非常简单。
而且,JNI 是一个非常重要的 Java 特性,这并不是什么坏建议。
对于 jni,请访问
http://www3.ntu.edu.sg/home/ehchua/programming/java/JavaNativeInterface.html http://docs.oracle.com/javase/1.5.0/docs/guide/jni/spec/jniTOC.html
有关 omp pdf 文档,请访问
http://www.openmp.org/mp-documents/OpenMP4.0.0.pdf
最后,您的实现可能如下所示:
calcu.java
calcu.h
calcu.c
计算.java:
//If this is a function in your class
public native float calculate(some parameters...); //without implementation in java
计算.h:
//generated by "javah" command automatically
//some thing above ommitted
JNIEXPORT float JNICALL Java_test_calculate(JNIEnv *, jclass, jbyteArray, jbyteArray);
// has this function declared in c automatically
计算.c:
#include "calcu.h"
#include "omp.h"
//implement the java native call here
JNIEXPORT float JNICALL Java_test_calculate(JNIEnv *, jclass, jbyteArray, jbyteArray)
{
...some code;
/*Here for example, we use a omp compile command for parallel loop*/
#pragma omp parallel for
for(...)
{} //this for will be automatically executed using parallel computing
}
此外,上述任务也可以在eclipse java项目中完成。您可以在 eclipse 中将 java 项目转换为 C/C++ Make-file 项目,并使用 gcc/g++ 构建链进行 jni。这将减轻您在终端中输入的大量工作。
====================================CUTCUTCUTCUTCUT============== =======================
对于那些不希望自己的 Java 代码被 C/C++ 搞乱的人,以下建议可能会有用:
据我所知,IBM.Cor 推出了一种名为“Threads洪水”的编码模式。该策略的核心思想是在可并行过程中创建尽可能多的线程,以达到VM native 任务调度性能的极限。
演示应如下所示:
import java.lang.*;
import java.util.regex.*;
import java.util.*;
public class test{
public test()
{
super();
}
public static void main(String[] arg)
{
ResultJoin rj=new ResultJoin();
for(int i=0;i<10;i++)
{
Task t=new Task(1.0*i,2.0*i);
new Emmitable(rj,t).start();
}
System.out.println(rj.getReuslt());
return;
}
}
interface TaskInterface
{
public double calcu();
}
interface ResultInterface
{
public void pushResult(double dat);
public double getReuslt();
}
class Emmitable extends Thread
{
private ResultInterface result=null;
private TaskInterface task=null;
public Emmitable(ResultInterface rj,TaskInterface tsk)
{result=rj;task=tsk;}
public void run()
{
result.pushResult(task.calcu());
}
}
class ResultJoin implements ResultInterface
{
private double sum=0;
public ResultJoin()
{}
public synchronized void pushResult(double i)
{
sum+=i;
}
public synchronized double getReuslt()
{
double result=sum;
return sum;
}
}
class Task implements TaskInterface
{
private double a;
private double b;
public Task(double na,double nb)
{
a=na;b=nb;
}
public double calcu()
{
return 1.0*a*b;
}
}
代码的直观效果是设置一堆“On Fly”线程并将它们的结果收集到一个地方。
什么时候使用这种模式比较好?
当你的每个并行结构都非常复杂时(不是像“sum+=i”这样的东西),这种模式将提供相当大的性能。
但是,如果您的并行任务像“sum=sum+i*j”一样简单,那么直接执行它而不进行任何并行实际上更好。因为,在微观范围内,“new Object().start()”比您的几行简单任务花费的时间要长得多。
关于java - 'parallelizing' 我的 for 循环是正确的选择吗? (没有 JNI/OPENMP),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26817013/
在 Oracle 中,PARALLEL 被广泛使用。提示 PARALLEL、PARALLEL(8) 和 PARALLEL(a,8) 有什么区别。如何选择最佳的查询提示? SELECT /*+ PARA
好的,我希望以前没有问过这个问题,因为在搜索中很难找到。 我查看了 F95 手册,但仍然觉得这很模糊: For the simple case of: DO i=0,99 END DO 我正
我有一个 C-shell 脚本,其中有一个名为 $hosts_string 的变量,格式为: host1,host2,...,hostN 我还有一个名为 $chrs_string 的变量,其形式为:
是否可以从由gnu parallel产生的脚本的多次运行中调用gnu parallel? 我有一个python脚本,可以运行100个顺序顺序迭代,并且在每次迭代中的某处,并行计算4个值(使用gnu p
我想在几个输入上运行几个长时间运行的进程。例如。: solver_a problem_1 solver_b problem_1 ... solver_b problem_18 solver_c pro
TParallel.&For 和 TParallel.For 之间有区别吗? 两者都可以在 Delphi 10 Seattle 中编译。那么我应该坚持哪一个呢? 最佳答案 TParallel.&For
我第一次使用 julia 进行并行计算.我有点头疼。所以假设我开始 julia如下:julia -p 4 .然后我为所有处理器声明 a 函数,然后将它与 pmap 一起使用还有@parallel fo
关闭。这个问题是off-topic .它目前不接受答案。 想改善这个问题吗? Update the question所以它是 on-topic对于堆栈溢出。 10年前关闭。 Improve this
我有一堆相互排斥的方法,因此可以并行运行。有这样做的好方法吗?到目前为止,我有以下两种实现方式,但我不确定是否应该选择其中一种。 使用 Parallel.For : Parallel.For(0, 2
我对并行运行脚本很感兴趣,并且我已经开始查看 GNU 并行工具,但是我遇到了一些麻烦。我的脚本 doSomething 有 3 个参数,我想在参数的不同值上并行运行脚本。我该怎么做? 我试过:para
我需要在多核(和多线程)机器上运行多个作业。我正在使用 GNU Parallel utility跨核心分配作业以加速任务。要执行的命令在名为“命令”的文件中可用。我使用以下命令运行 GNU Paral
我正在尝试使用如下两个输入运行 Python 脚本。我得到了大约 300 个这两个输入,所以我想知道是否有人可以建议如何并行运行它们。 单次运行看起来像: python stable.py KOG_1
每天我都必须更新一堆存储库,并在其中一些中执行另一个命令(来自 CARTON,Perl 模块依赖管理器)。我总是使用循环来执行此操作,但我想与 并行执行GNU 并行 如果可能,但我不太了解它的tuto
正如标题所说:@parallel 之间究竟有什么区别?和 pmap ?我的意思不是明显的一个是循环的宏,另一个适用于函数,我的意思是它们的实现究竟有什么不同,我应该如何使用这些知识在它们之间进行选择?
我有一些矩阵乘法运算。我想通过多个处理器并行执行这些操作。这可以使用 MPI(消息传递接口(interface))在高性能计算集群上完成。 同样,我可以使用多个辅助角色在云中进行一些并行化吗?有什么办
joblib模块提供了一个简单的帮助程序类,以使用多处理并行编写循环的循环。 这段代码使用列表推导来完成这项工作: import time from math import sqrt from job
我的问题是这样的one .但我想做一些不同的事情... 例如,在我的并行区域内,我想在 4 个线程上运行我的代码。当每个线程进入 for 循环时,我想在 8 个线程上运行我的代码。像 #pramga
我正在尝试使用 ipython 并行库中的并行计算。但是我对此知之甚少,而且我发现很难从对并行计算一无所知的人那里阅读该文档。 有趣的是,我发现的所有教程都只是重复使用文档中的示例,并使用相同的解释,
我的项目结构看起来像 Root + subproj1 + subproj2 在每个子项目中定义了自己的任务 run(){}。 我想要做的是从 Root 项目的运行任务并行运行 :subpro
我有一个 Foo ID 的列表。我需要为每个 ID 调用一个存储过程。 例如 Guid[] siteIds = ...; // typically contains 100 to 300 elemen
我是一名优秀的程序员,十分优秀!