- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在从事一个并行计算项目,但遇到了核心通信问题。该程序可以运行,但在各个方面都遇到了问题。程序达到的点取决于所使用的核心数。所以我要通过对高度振荡函数的各种方法求和来计算积分。每个计算应在核心之间拆分并相加。它应该通过各种波数来展示行为。所以我需要将每个计算分成几个部分,然后将它们分派(dispatch)到核心,然后将它们带回来并对它们求和。在此之后我需要为下一个波数重复它,这些波数是 [100,10000]。积分区域从 0 到 pi,每个需要使用波数分成相等的部分。
对于这段代码,如果我在一个内核上运行它,我可以将它设为波数 120,如果我使用 2 个内核,它会一直运行到大约 240 个波数,3 个内核是 360,4 个内核是 477。这种趋势会持续更多或更少。
非常感谢任何有关我需要修复的问题的见解。
#include <iostream>
#include <fstream>
#include <vector>
#include <typeinfo>
#include "mpi.h"
#include "math.h"
using namespace std;
double fun_val_points(int kw, double x);
vector<double> integrand(double (fn)(int wn, double x), double wn,
vector<double> pts, int qn);
const double PI = 3.141592653589793;
int main(int argc, char* argv[]) {
MPI::Init(argc, argv);
for (int wavenum = 100; wavenum <= 10000; wavenum++){
// Declare variables
int rank, numcores, tag = 123;
int div, rem, qn = 101; // qn represents the number of
//quadrature points
// Initialize variables
rank = MPI::COMM_WORLD.Get_rank();
numcores = MPI::COMM_WORLD.Get_size();
div = int((wavenum+1) / numcores);
rem = (wavenum+1) % numcores;
vector<double>points(div + rem, 0.0);
if (rank == 0) {
vector<double> quadraturePoints(wavenum + 1, 0.0);
//quadraturePoints needs to be k+1 equally spaced points
// between 0 and pi. It then needs to be
//distributed
// to each core in a load balanced way.
for (int i = 0; i < wavenum + 1; i++) {
quadraturePoints[i] = PI * (i) / (wavenum); // Initialize
//quadraturePoints
}
for (int j = 0; j < numcores - 1; j++) {
vector<double> sendpoints = vector<double>(div + rem, 0.0);
int index = 0;
for (int n = j * div; (n <= (j + 1) * div) && (index < div + rem); n++) {
sendpoints[index++] = quadraturePoints[n]; // Get the
//relevent quadrature points for this core
}
//Send the data to the core
MPI::COMM_WORLD.Send(&sendpoints[0], sendpoints.size(), MPI_DOUBLE, j, tag);
}
// Send data to the last core, which needs to have any remaining
//quadrature points
vector<double> sendpoints = vector<double>(div + rem, 0.0);
int index = 0;
for (int n = (numcores-1) * div; n < wavenum + 1; n++) {
sendpoints[index++] = quadraturePoints[n];
}
MPI::COMM_WORLD.Send(&sendpoints[0], sendpoints.size(), MPI_DOUBLE, numcores - 1, tag);
}
vector<double> localQuads(div+rem,0.0);
// Recieve the quadrature points for local calculation
MPI::COMM_WORLD.Recv(&localQuads[0], div + rem + 1, MPI_DOUBLE, 0, tag);
while(!localQuads.empty() && localQuads.back() <= .00000001){
localQuads.pop_back(); // Remove any spare 0's on the end of the quad
//points.
// This is here because some quadrature points
//were sent as longer lists than necessary
// so that they would all be the same length
}
vector<double> localWTS(3, 0.0); // To keep track of the integrals
//across the local quad points
for(int i = 0; i < localQuads.size()-1; i++){
vector<double> partition(qn+1, 0.0); // Partition the quadrature
for (double j = 0; j < qn+1; j++){
partition[j] = localQuads[i] + (j/qn)*(localQuads[i+1] - localQuads[i]);
}
vector<double> temp = integrand(fun_val_points, wavenum, partition,
partition.size()); // Integrate the partition
for (int j = 0; j < 3; j++){
localWTS[j] += temp[j]; // Add the integrated values to the running
//total
}
}
// Send the local integration values back to master
MPI::COMM_WORLD.Send(&localWTS[0], 3, MPI_DOUBLE, 0, tag);
if (rank == 0) {
vector<double> totalWTS(3, 0.0);
for (int commRank = 0; commRank < numcores; commRank++) {
MPI::COMM_WORLD.Recv(&localWTS[0], 3, MPI_DOUBLE, commRank, tag);
// Gather all the integral values and add them to the running total
for (int index = 0; index < 3; index++) {
totalWTS[index] += localWTS[index];
}
}
ofstream out; // Open a text file for output to disk
out.open("data.txt", ios_base::app);
if(!out.is_open()){ // In case there was an error opening the file
cout << "Error opening output file." << endl;
}
out << wavenum << " ";
out.precision(16);
out << totalWTS[0] << " " << totalWTS[1] << " " << totalWTS[2] << endl;
out.close();
}
}
MPI::Finalize();
return 0;
}
double fun_val_points(int kw, double x) {
return cos(100 * x - kw*sin(x));
}
vector<double> integrand(double (fn)(int wn, double x), double wn,vector<double> pts, int qn) {
double M, T, S;
M = 0;
T = 0;
for (int j = 1; j < qn; j++) {
double len = pts[j] - pts[j - 1];
double mpts = (pts[j] + pts[j - 1]) / 2;
M += fn(wn, mpts)*len;
T += (fn(wn, pts[j - 1]) + fn(wn, pts[j]))*len / 2;
}
S = M * 2 / 3 + T * 1 / 3;
return {M, T, S};
}
最佳答案
关于 MPI 标准,您的程序不正确。
原因是任务 0 MPI_Send()
到它自己并且没有接收到。
从务实的角度来看,这对小消息“有效”,但对大消息则挂起。请注意,小与大取决于您的 MPI 库、您使用的互连以及其他因素,所以长话短说,假设此模式会导致挂起并且不要这样做。
这通常可以通过使用 MPI_Irecv()
或 MPI_Sendrecv()
来避免。
也就是说,您的通信模式正在请求 MPI 集体操作:MPI_Scatterv(quadraturePoints, ...)
然后是 MPI_Reduce(localWTS, ...)
关于C++ MPI 发送接收问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49397973/
我有一个存储结构向量的应用程序。这些结构保存有关系统上每个 GPU 的信息,如内存和 giga-flop/s。每个系统上有不同数量的 GPU。 我有一个程序可以同时在多台机器上运行,我需要收集这些数据
我很好奇 MPI 中缺少此功能: MPI_Isendrecv( ... ); 即,非阻塞发送和接收,谁能告诉我其省略背后的基本原理? 最佳答案 我的看法是 MPI_SENDRECV存在是为了方便那些想
当我用以下方法监听TCP或UDP套接字时 ssize_t recv(int sockfd, void *buf, size_t len, int flags); 或者 ssize_t recvfrom
SUM:如何在 azure 事件网格中推迟事件触发或事件接收? 我设计的系统需要对低频对象状态(创建、启动、检查长时间启动状态、结束)使用react。它看起来像是事件处理的候选者。我想用azure函数
我正在 MPI 中实现一个程序,其中主进程(等级 = 0)应该能够接收来自其他进程的请求,这些进程要求只有根才知道的变量值。如果我按等级 0 进行 MPI_Recv(...),我必须指定向根发送请求的
我正在学习DX12,并在此过程中学习“旧版Win32”。 我在退出主循环时遇到问题,这似乎与我没有收到WM_CLOSE消息有关。 在C++,Windows 10控制台应用程序中。 #include
SUM:如何在 azure 事件网格中推迟事件触发或事件接收? 我设计的系统需要对低频对象状态(创建、启动、检查长时间启动状态、结束)使用react。它看起来像是事件处理的候选者。我想用azure函数
我想编写方法来通过号码发送短信并使用编辑文本字段中的文本。发送消息后,我想收到一些声音或其他东西来提醒我收到短信。我怎样才能做到这一点?先感谢您,狼。 最佳答案 这个网站似乎对两者都有很好的描述:ht
所以我正在用 Java 编写一个程序,在 DatagramSocket 和 DatagramPacket 的帮助下发送和接收数据。问题是,在我发送数据/接收数据之间的某个时间 - 我发送数据的程序中的
我是 Android 编程新手,我正在用 Java 编写一个应用程序,该应用程序可以打开相机拍照并保存。我通过 Intents 做到了,但看不到 onActivityResult 正在运行。 我已经在
我有一个套接字服务器和一个套接字客户端。客户端只有一个套接字。我必须使用线程在客户端发送/接收数据。 static int sock = -1; static std::mutex mutex; vo
我正在尝试使用 c 中的套接字实现 TCP 服务器/客户端。我以这样的方式编写程序,即我们在客户端发送的任何内容都逐行显示在服务器中,直到键入退出。该程序可以运行,但数据最后一起显示在服务器中。有人可
我正在使用微 Controller 与 SIM808 模块通信,我想发送和接收 AT 命令。 现在的问题是,对于某些命令,我只收到了我应该收到的答案的一部分,但对于其他一些命令,我收到了我应该
我用c设计了一个消息传递接口(interface),用于在我的系统中运行的不同进程之间提供通信。该接口(interface)为此目的创建 10-12 个线程,并使用 TCP 套接字提供通信。 它工作正
我需要澄清一下在套接字程序中使用多个发送/接收。我的客户端程序如下所示(使用 TCP SOCK_STREAM)。 send(sockfd,"Messgfromlient",15,0);
我正在构建一个真正的基本代理服务器到我现有的HTTP服务器中。将传入连接添加到队列中,并将信号发送到另一个等待线程队列中的一个线程。此线程从队列中获取传入连接并对其进行处理。 问题是代理程序真的很慢。
我正在使用 $routeProvider 设置一条类似 的路线 when('/grab/:param1/:param2', { controller: 'someController',
我在欧洲有通过 HLS 流式传输的商业流媒体服务器。http://europe.server/stream1/index.m3u8现在我在美国的客户由于距离而遇到一些网络问题。 所以我在美国部署了新服
我有一个长期运行的 celery 任务,该任务遍历一系列项目并执行一些操作。 任务应该以某种方式报告当前正在处理的项目,以便最终用户知道任务的进度。 目前,我的django应用程序和celery一起坐
我需要将音频文件从浏览器发送到 python Controller 。我是这样做的: var xmlHttp = new XMLHttpRequest(); xmlHttp.open( "POST",
我是一名优秀的程序员,十分优秀!