gpt4 book ai didi

c - 不同架构的集群应该指定哪个AVX和march?

转载 作者:行者123 更新时间:2023-12-03 16:02:15 29 4
gpt4 key购买 nike

我目前正在尝试使用英特尔编译器编译用于 HPC-Cluster 的软件。我编译和准备计算的登录节点使用 Intel Xeon Gold 6148处理器,而计算节点使用 Haswell- ( Intel Xeon E5-2660 v3/Intel Xeon Processor E5-2680 v3 ) 或 Skylake 处理器 ( Intel Xeon Gold 6138 )。

据我从上面的链接了解到,我的登录节点支持 Intel SSE4.2、Intel AVX、Intel AVX2 以及 Intel AVX-512,但我的计算节点仅支持 Intel AVX2 (Haswell) 或 Intel AVX-512 (天湖)

如果我使用选项 -xHost 进行编译在登录节点上,它应该自动使用可用的最高指令集。但哪个是最高的?我如何确保我的程序以最佳性能在两个计算系统上运行?我必须编译两个版本吗?
奖金问题:哪个-march在这种情况下我必须指定吗?

最佳答案

由于您使用的是 Intel Compiler,您可以使用它的 《处理器自动调度》能力以创建“胖”通用二进制文件,其中包含 SSE 兼容、AVX 兼容等版本。因此,当您在仅支持 SSE 的机器上运行“胖”二进制文件时,只会执行二进制文件的经过 SSE 优化的部分(代码路径)。当您在 AVX 机器上运行相同的“胖”二进制文件时,将执行二进制文件的 AVX 优化部分。这是一个非常强大但并不为人所知的功能。

您可以使用 的组合启用它-ax -x 英特尔编译器编译标志。
这个想法是基本上你通过-ax指定最高的ISA和通过-x指定默认/“最低”的ISA。

https://www.chpc.utah.edu/documentation/software/single-executable.php#submit 中简要描述了给定的“-ax”胖二进制技术。

更多细节可以在给定的漂亮铝箔甲板的第 9 页找到:https://www.alcf.anl.gov/files/ken_intel_compiler_optimization.pdf

最后,我应该提到,在您的描述中,您对 ISA 的关系有些困惑。带有 AVX512 的 Intel x86 处理器 - 将始终支持 AVX2。 AVX2 机器将始终支持 SSE。 super 简单的解释:AVX512 有点像 AVX/AVX2 的超集,而 AVX/AVX2 可以看作是 SSE 的超集(事实上它不是,但 SSE 在 AVX 机器上始终可用,但不是反之亦然)。

不管你提到了 Haswell(AVX2 机器,所以 SSE 在船上,但这里自然没有 AVX512)和 Skylake(AVX512 机器,所以 AVX2 和 SSE 在船上)。因此,您可能需要像 -axCORE-AVX512 -xCORE-AVX2 这样的东西(在您的列表中没有低于 AVX2 的机器 - 即没有 SSE 或 AVX(1) 机器)。你好像只有 Skylake 服务器和 Haswell 服务器。

关于c - 不同架构的集群应该指定哪个AVX和march?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62215122/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com