- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前正在尝试使用英特尔编译器编译用于 HPC-Cluster 的软件。我编译和准备计算的登录节点使用 Intel Xeon Gold 6148处理器,而计算节点使用 Haswell- ( Intel Xeon E5-2660 v3/Intel Xeon Processor E5-2680 v3 ) 或 Skylake 处理器 ( Intel Xeon Gold 6138 )。
据我从上面的链接了解到,我的登录节点支持 Intel SSE4.2、Intel AVX、Intel AVX2 以及 Intel AVX-512,但我的计算节点仅支持 Intel AVX2 (Haswell) 或 Intel AVX-512 (天湖)
如果我使用选项 -xHost
进行编译在登录节点上,它应该自动使用可用的最高指令集。但哪个是最高的?我如何确保我的程序以最佳性能在两个计算系统上运行?我必须编译两个版本吗?
奖金问题:哪个-march
在这种情况下我必须指定吗?
最佳答案
由于您使用的是 Intel Compiler,您可以使用它的 《处理器自动调度》能力以创建“胖”通用二进制文件,其中包含 SSE 兼容、AVX 兼容等版本。因此,当您在仅支持 SSE 的机器上运行“胖”二进制文件时,只会执行二进制文件的经过 SSE 优化的部分(代码路径)。当您在 AVX 机器上运行相同的“胖”二进制文件时,将执行二进制文件的 AVX 优化部分。这是一个非常强大但并不为人所知的功能。
您可以使用 的组合启用它-ax 和 -x 英特尔编译器编译标志。
这个想法是基本上你通过-ax指定最高的ISA和通过-x指定默认/“最低”的ISA。
在 https://www.chpc.utah.edu/documentation/software/single-executable.php#submit 中简要描述了给定的“-ax”胖二进制技术。
更多细节可以在给定的漂亮铝箔甲板的第 9 页找到:https://www.alcf.anl.gov/files/ken_intel_compiler_optimization.pdf
最后,我应该提到,在您的描述中,您对 ISA 的关系有些困惑。带有 AVX512 的 Intel x86 处理器 - 将始终支持 AVX2。 AVX2 机器将始终支持 SSE。 super 简单的解释:AVX512 有点像 AVX/AVX2 的超集,而 AVX/AVX2 可以看作是 SSE 的超集(事实上它不是,但 SSE 在 AVX 机器上始终可用,但不是反之亦然)。
不管你提到了 Haswell(AVX2 机器,所以 SSE 在船上,但这里自然没有 AVX512)和 Skylake(AVX512 机器,所以 AVX2 和 SSE 在船上)。因此,您可能需要像 -axCORE-AVX512 -xCORE-AVX2 这样的东西(在您的列表中没有低于 AVX2 的机器 - 即没有 SSE 或 AVX(1) 机器)。你好像只有 Skylake 服务器和 Haswell 服务器。
关于c - 不同架构的集群应该指定哪个AVX和march?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62215122/
是否可以简化在裸机上运行的这条链: 具有随时间变化的副本数的 StatefulSet 服务 使用 proxy-next-upstream: "error http_502 timeout invali
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我需要为应用程序制定架构。它专为销售产品而设计。 系统每天将接受大约 30-40k 的新产品。它将导致在表 product 中创建新记录。 系统应保留价格历史记录。用户应该能够看到产品 A 的价格在去
我需要一些帮助来理解 PHP 的内部工作原理。 还记得,在过去,我们曾经写过 TSR(Terminate and stay resident)例程(pre-windows 时代)吗?一旦该程序被执行,
1.Nginx 基础架构 nginx 启动后以 daemon 形式在后台运行,后台进程包含一个 master 进程和多个 worker 进程。如下图所示: master与
本文深入探讨了Kubernetes(K8s)的关键方面,包括其架构、容器编排、网络与存储管理、安全与合规、高可用性、灾难恢复以及监控与日志系统。 关注【TechLeadCloud】,
我知道 CNN 的工作原理,包括每一层的用途(Dropout、Pooling 等)。但是,在为新数据集设计 CNN 时,我不知道要使用多少个 Conv-Relu-Pool 层,在最终获得输出之前我应该
在基于 REST 的架构中,资源和方法之间有什么区别。有吗? 最佳答案 资源是您的应用程序定义的东西;它们与物体非常相似。方法是 HTTP 动词之一,例如 GET、POST、PUT、DELETE。它们
我想用 oneOf仅在 xyType 的值上不同的模式属性(property)。我想要其中两个:一个是 xyType设置为 "1"第二个在哪里xyType是 任何其他值 .这可以使用 json 模式完
寻求 PHP 架构师的建议! 我对 PHP 不是很熟悉,但已经接管了一个用该语言编写的大型分析包的维护工作。该架构旨在将报告的数据读取到大型键/值数组中,这些数组通过各种解析模块传递,以提取每个模块已
这些存在吗? 多年来,我一直是大型强类型面向对象语言(Java 和 C#)的奴隶,并且是 Martin Fowler 及其同类的信徒。 Javascript,由于它的松散类型和函数性质,似乎不适合我习
我已经阅读了 Manning 的 Big Data Lambda Architecture ( http://www.manning.com/marz/BD_meap_ch01.pdf ),但仍然无法
在过去的几年里,我做了相当多的 iOS 开发,所以我非常熟悉 iOS 架构和应用程序设计(一切都是一个 ViewController,您可以将其推送、弹出或粘贴到选项卡栏中)。我最近开始探索正确的 M
我有以下应用程序,我在其中循环一些数据并显示它。 {{thing.title}} {{thing.description}}
昨天我和我的伙伴讨论了我正在开发的这个电子购物网站的架构。请注意,我为此使用 ASP.NET。他非常惊讶地发现我没有将添加到购物车的项目保留在 ArrayList 或其他通用列表中,而是使用 LINQ
我正在使用在 tridion 蓝图层次结构中处于较低位置的出版物。从蓝图中较高级别的出版物继承的一些内容和模式不适合我的出版物,并且永远不会被我的出版物使用。 我将跟进添加这些项目的内部团队,并尝试说
我目前已经在 Cassandra 中设计了一个架构,但我想知道是否有更好的方法来做事情。基本上,问题在于大多数(如果不是全部)读取都是动态的。我构建了一个分段系统作为应用程序服务,读取动态自定义查询(
我正在按照 documentation 中给出的 icingaweb UI v 2.0 布局执行在服务器上设置 icinga 的步骤。 。我成功进入设置页面,该页面要求您输入 token ,然后按照步
我必须保存来自不同社交媒体的用户的不同个人资料。例如用户可能有 1 个 Facebook 和 2 个 Twitter 个人资料。如果我保存每个配置文件它作为新文档插入不同的集合中,例如 faceboo
我的团队使用 Puppet 架构,该架构目前可在多个环境(流浪者、暂存、生产)中容纳单个应用程序。 我们现在想要扩展此设置的范围以支持其他应用程序。他们中的许多人将使用我们已经定义的现有模块的子集,而
我是一名优秀的程序员,十分优秀!