gpt4 book ai didi

c++ - 不完整的多线程 RayTracer 花费的时间是预期的两倍

转载 作者:行者123 更新时间:2023-11-28 04:41:22 28 4
gpt4 key购买 nike

我正在制作 MT Ray-Tracer 多线程,正如标题所说,它的执行时间是单线程版本的两倍。显然目的是将渲染时间缩短一半,然而我现在所做的只是让光线追踪方法运行两次,每个线程一次,基本上是将相同的渲染执行两次。尽管如此,由于线程可以并行运行,因此执行时间不会有明显的增加。但是是关于加倍。

这必须与我的多线程设置有关。我认为这与我将它们创建为可连接的事实有关。因此,我将解释我在做什么,并将相关代码放在一起,看看是否有人可以确认这是否是问题所在。

我创建了两个线程并将它们设置为可连接。创建一个 RayTracer,分配足够的内存来存储图像像素(这是在构造函数中完成的)。运行两次迭代循环以发送每个线程的相关信息,例如线程 ID 和 Raytracer 实例的地址。

然后pthread_create调用run_thread,其目的是在工作完成的地方调用ray_tracer:draw方法。在 draw 方法上,我有一个

 pthread_exit (NULL); 

作为它上面的最后一件事(上面唯一的 MT 东西)。然后再做一个循环加入线程。最后我开始在一个小循环中写入文件。最后关闭文件,删除draw方法中用来存放图像的数组相关的指针。

我现在可能不需要使用加入,因为我不是在做一个“真正的”多线程光线追踪器,只是渲染它两次,但是一旦我开始在图像像素之间交替(即线程 0 -> 渲染像素 0 - 线程 0 -> 存储像素 0,线程 1 -> 渲染像素 1 - 线程 1 -> 存储像素 1,线程 0 -> 渲染像素 2 - 线程 0 -> 存储像素 2,线程 1 -> 渲染像素 3 - 线程 1 -> 存储像素 3,等等...)我我想我需要它以便能够在文件中以正确的顺序写入像素。

这样对吗?我真的需要在我的方法(或任何其他方法)中使用 join here 吗?如果我这样做,我怎样才能让线程同时运行,而不是等待另一个线程完成?这个问题与加入完全无关吗?

pthread_t threads [2];
thread_data td_array [2];
pthread_attr_t attr;
void *status;
pthread_attr_init(&attr);
pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_JOINABLE);
TGAManager tgaManager ("z.tga",true);
if (tgaManager.isFileOpen()) {
tgaManager.writeHeadersData (image);
RayTracer rt (image.getHeight() * image.getWidth());
int rc;
for (int i=0; i<2; i++) {
//cout << "main() : creating thread, " << i << endl;
td_array[i].thread_id=i;
td_array[i].rt_ptr = &rt;
td_array[i].img_ptr = &image;
td_array[i].scene_ptr = &scene;
//cout << "td_array.thread_index: " << td_array[i].thread_id << endl;
rc = pthread_create (&threads[i], NULL, RayTracer::run_thread, &td_array[i]);
}
if (rc) {
cout << "Error:unable to create thread," << rc << endl;
exit(-1);
}
pthread_attr_destroy(&attr);
for (int i=0; i<2; i++ ) {
rc = pthread_join(threads[i], &status);
if (rc) {
cout << "Error:unable to join," << rc << endl;
exit(-1);
}
}
//tgaManager.writeImage (rt,image.getSize());

for (int i=0; i<image.getWidth() * image.getHeight(); i++) {
cout << i << endl;
tgaManager.file_writer.put (rt.b[i]);
tgaManager.file_writer.put (rt.c[i]);
tgaManager.file_writer.put (rt.d[i]);
}
tgaManager.closeFile(1);
rt.deleteImgPtr ();
}

最佳答案

你确实想要 join() 线程,因为如果你不这样做,你会遇到几个问题:

  1. 您如何知道线程何时完成执行?您不希望开始写出结果图像时才发现它在您写出时还没有完全计算出来。

  2. 您如何知道何时可以安全地拆除线程可能正在访问的任何数据结构?例如,您的 RayTracer 对象在堆栈上,并且(AFAICT)您的线程正在写入其像素数组。如果您的主函数在线程退出之前返回,则很有可能线程有时最终会写入不再存在的 RayTracer 对象,这将通过覆盖任何内容来破坏堆栈在您的函数返回后,其他对象可能(偶然)存在于这些相同位置。

所以你肯定需要 join() 你的线程;不过,您不需要将它们显式声明为 PTHREAD_CREATE_JOINABLE,因为该属性无论如何都已默认设置。

加入线程不应导致线程变慢,只要创建并运行两个线程之前您对其中任何一个调用 join()(这在您的发布代码)。

至于为什么您会看到两个线程速度变慢,这很难说,因为速度减慢可能来自多个地方。一些可能性:

  1. 您的光线追踪代码中的某些东西正在锁定一个互斥量,这样对于大部分光线追踪运行来说,无论如何一次只允许两个线程中的一个执行。

    <
  2. 两个线程大约同时写入相同的内存位置,这会导致缓存争用,从而减慢两个线程的执行速度。

我的建议是设置线程,使线程 #1 仅渲染图像的上半部分,而线程 #2 仅渲染图像的下半部分;这样,当他们写入输出时,他们将写入不同的内存部分。

如果这没有帮助,您可以暂时将渲染代码替换为更简单的代码(例如,将像素设置为随机值的“渲染器”),看看是否可以加速。如果是这样,那么您的 RayTracer 实现中可能存在不支持多线程的内容。

关于c++ - 不完整的多线程 RayTracer 花费的时间是预期的两倍,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50125322/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com