- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想将代码中的线程绑定(bind)到每个物理内核。
使用 GCC,我已经使用 sched_setaffinity
成功完成了这项工作。所以我不再需要设置 export OMP_PROC_BIND=true
.我想在 Windows 中使用 MSVC 做同样的事情。 Windows 和 Linux 使用不同的线程拓扑。 Linux 分散线程,而 Windows 使用紧凑形式。换句话说,在具有四个内核和八个超线程的 Linux 中,我只需要将线程绑定(bind)到前四个处理单元。在 Windows 中,我将它们设置为每个其他处理单元。
我已经使用 SetProcessAffinityMask
成功完成了这项工作。 .当我右键单击进程并单击“设置亲和性”时,我可以从 Windows 任务管理器中看到所有其他 CPU 已设置(我的八个超线程系统上的 0、2、4、6)。问题是我的代码运行时效率不稳定。有时它几乎是恒定的,但大多数时候它有很大的变化。我将优先级更改为高,但没有区别。在Linux中效率是稳定的。也许 Windows 仍在迁移线程?我还需要做些什么来绑定(bind) Windows 中的线程吗?
这是我正在使用的代码
#ifdef _WIN32
HANDLE process;
DWORD_PTR processAffinityMask = 0;
//Windows uses a compact thread topology. Set mask to every other thread
for(int i=0; i<ncores; i++) processAffinityMask |= 1<<(2*i);
//processAffinityMask = 0x55;
process = GetCurrentProcess();
SetProcessAffinityMask(process, processAffinityMask);
#else
cpu_set_t mask;
CPU_ZERO(&mask);
for(int i=0; i<ncores; i++) CPU_SET(i, &mask);
sched_setaffinity(0, sizeof(mask), &mask);
#endif
#ifdef _WIN32
HANDLE process;
DWORD_PTR processAffinityMask;
//Windows uses a compact thread topology. Set mask to every other thread
for(int i=0; i<ncores; i++) processAffinityMask |= 1<<(2*i);
process = GetCurrentProcess();
SetProcessAffinityMask(process, processAffinityMask);
#pragma omp parallel
{
HANDLE thread = GetCurrentThread();
DWORD_PTR threadAffinityMask = 1<<(2*omp_get_thread_num());
SetThreadAffinityMask(thread, threadAffinityMask);
}
#else
cpu_set_t mask;
CPU_ZERO(&mask);
for(int i=0; i<ncores; i++) CPU_SET(i, &mask);
sched_setaffinity(0, sizeof(mask), &mask);
#pragma omp parallel
{
cpu_set_t mask;
CPU_ZERO(&mask);
CPU_SET(omp_get_thread_num(),&mask);
pthread_setaffinity_np(pthread_self(), sizeof(mask), &mask);
}
#endif
最佳答案
您应该使用 SetThreadAffinityMask
函数(见 MSDN reference)。您正在设置 流程 的面具。
您可以获得thread ID
在 OpenMP 中使用以下代码:
int tid = omp_get_thread_num();
thread ID
,而不是系统
thread ID
.本文解释了有关该主题的更多信息:
affinity type
如本英特尔文档中所述:
关于multithreading - 与 Windows、MSVC 和 OpenMP 的线程关联,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24862488/
我有两个单独编译的DLL,一个是从Visual Studio2008编译的,另一个是从MATLAB编译的MEX文件。这两个DLL都包含一个头文件。当我获取一个DLL中的结构sizeof()时,它返回4
一位同事更喜欢尤达的条件:。这在团队中是一种有争议的风格,并且提出的一个论点是,如果(x=0),编译器可以一致地发出警告来检测错误模式。。然而,msvc似乎没有检测到类(https://godbolt
while (getline(stream, thisword, ' ') != 0) {... 我可以在 MSVC 2012 下编译这一行。通过传递一个“SPC”字符作为字符串分隔符,它应该测试输入
我使用较早版本的 Cocos2dx 编写游戏并使用 VS 2013 对其进行编译。请注意,我使用的是 CMake 和 Qt Creator 以及两个编译器版本。当 Cocos2dx v3.12 出来时
我正在尝试在 Windows 10 64 位下的 Python 3.8.3 上安装 chatterbot 包并遇到一个奇怪的错误,我怀疑它一定与某些目录或 PATH 设置有关,我希望这是一个简单的修复
知乎Where and why do we have to put the template and typename keywords , 我很惊讶地得知 MSVC accepts以下代码: str
在摆弄复制省略时,我遇到了这种奇怪的行为: class Obj { public: Obj() = default; Obj(Obj&&) = delete; Obj(const Obj
以下代码使用 gcc 和 clang(以及许多其他 C++11 编译器)进行编译 #include typedef int datatype; template struct to_datatyp
我已经阅读了很多帖子,但我不明白如何在命令行中使用 MSVC 在 Windows 上创建一个简单的动态库。我正在做的是: 1º) 编写 DLL 代码 动态.h #pragma once __decls
我有以下代码无法与MSVC一起编译。使用gcc,clang和icc可以正常编译。我想这是个错误,对不对? 您有/知道一些解决方法吗? #include struct A { template
我已经阅读了很多帖子,但我不明白如何在命令行中使用 MSVC 在 Windows 上创建一个简单的动态库。我正在做的是: 1º) 编写 DLL 代码 动态.h #pragma once __decls
我有一个简单的 C++ 代码,我尝试使用 Visual Studio 2019 进行编译: #include #include int main() { std::cout << "Hel
有没有办法告诉MSVC编译器在短时间内不要修改某个寄存器?就像在一个小循环中,告诉它不要使用 ebx 寄存器(它可以使用任何其他寄存器)。在这种情况下,压入和弹出寄存器不起作用,因为在我将其弹出后,M
Borland C 有伪寄存器 _AX、_BX、_FLAGS 等,可以在“C”代码中使用它们将寄存器保存到临时变量。 是否有任何 MSVC 等效项?我尝试了@AX、@BX等,但编译器(MSVC1.5)
美好的一天, 我在 C++ 中尝试新事物,我发现 Visual Studio 中的调试和发布配置给我不同的结果。 #include #include #include #include #in
我想我在 MSVC 的编译器(MSVC Ultimate 2012 版本 11.0.61030.00 更新 4)中发现了一个错误。 #include "stdafx.h" class Base { p
我正在使用 Haxe 的 HXCPP 生成 C++ 代码并使用 Microsoft Visual Studio 2010 Express Edition 对其进行编译。我正在关注 this指南,它会要
我正在使用 Microsoft Visual Studio 2008 (C++)。我有一个要在 Debug模式下构建的解决方案。我引用了一些第三方库(例如 MyGUI)。在调试构建结束时,链接器给出了
老计算机程序员遇到新问题:-) 我正在将一个 CMake 文件项目移至 Visual Studio,并且该 CMake 项目中有数百个包含路径。 我当然可以一劳永逸地修补它们,但这会经常发生在不同的机
我有下一个功能: namespace TEST { class TEST { int a; int b; }; } namespace UNION_TE
我是一名优秀的程序员,十分优秀!