gpt4 book ai didi

multithreading - OpenMP 行为检测 CPU 和线程

转载 作者:行者123 更新时间:2023-12-01 05:36:28 24 4
gpt4 key购买 nike

我刚开始使用 OpenMP,我刚刚用 gcc -fopenmp openmp_c_helloworld.c 编译下面的一段代码:

#include <omp.h>
#include <stdio.h>
#include <stdlib.h>

int main (int argc, char *argv[]) {
int th_id, nthreads;
#pragma omp parallel private(th_id)
{
th_id = omp_get_thread_num();
printf("Hello World from thread %d\n", th_id);
#pragma omp barrier
if ( th_id == 0 ) {
nthreads = omp_get_num_threads();
printf("There are %d threads\n",nthreads);
}
}
return EXIT_SUCCESS;
}

我只是在带有超线程的四核 Intel CPU 上运行可执行文件,并获得以下输出:
Hello World from thread 2
Hello World from thread 0
Hello World from thread 3
Hello World from thread 1
There are 4 threads

从技术上讲,我的 CPU 上有 8 个可用线程和 4 个 CPU 核心,为什么 OpenMP 只显示 4 个线程?

最佳答案

简单地说,我认为这是因为 OpenMP 寻找 CPU(核心)的数量而不是处理器线程的数量。
this页面:`

Implementation default - usually the number of CPUs on a node, though it could be dynamic (see next bullet).



您可以尝试将程序中的线程数设置为等于处理器线程数,然后查看是否有性能改进(您必须创建自己的基准测试程序)。
在并行编程中,当工作线程数等于处理器线程数时,可以获得良好的性能。您也可以为 I/O 保留一两个额外的线程。

关于multithreading - OpenMP 行为检测 CPU 和线程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8368686/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com