- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前正在尝试使用英特尔编译器编译用于 HPC-Cluster 的软件。我编译和准备计算的登录节点使用 Intel Xeon Gold 6148处理器,而计算节点使用 Haswell- ( Intel Xeon E5-2660 v3/Intel Xeon Processor E5-2680 v3 ) 或 Skylake 处理器 ( Intel Xeon Gold 6138 )。
据我从上面的链接了解到,我的登录节点支持 Intel SSE4.2、Intel AVX、Intel AVX2 以及 Intel AVX-512,但我的计算节点仅支持 Intel AVX2 (Haswell) 或 Intel AVX-512 (天湖)
如果我使用选项 -xHost
进行编译在登录节点上,它应该自动使用可用的最高指令集。但哪个是最高的?我如何确保我的程序以最佳性能在两个计算系统上运行?我必须编译两个版本吗?
奖金问题:哪个-march
在这种情况下我必须指定吗?
最佳答案
由于您使用的是 Intel Compiler,您可以使用它的 《处理器自动调度》能力以创建“胖”通用二进制文件,其中包含 SSE 兼容、AVX 兼容等版本。因此,当您在仅支持 SSE 的机器上运行“胖”二进制文件时,只会执行二进制文件的经过 SSE 优化的部分(代码路径)。当您在 AVX 机器上运行相同的“胖”二进制文件时,将执行二进制文件的 AVX 优化部分。这是一个非常强大但并不为人所知的功能。
您可以使用 的组合启用它-ax 和 -x 英特尔编译器编译标志。
这个想法是基本上你通过-ax指定最高的ISA和通过-x指定默认/“最低”的ISA。
在 https://www.chpc.utah.edu/documentation/software/single-executable.php#submit 中简要描述了给定的“-ax”胖二进制技术。
更多细节可以在给定的漂亮铝箔甲板的第 9 页找到:https://www.alcf.anl.gov/files/ken_intel_compiler_optimization.pdf
最后,我应该提到,在您的描述中,您对 ISA 的关系有些困惑。带有 AVX512 的 Intel x86 处理器 - 将始终支持 AVX2。 AVX2 机器将始终支持 SSE。 super 简单的解释:AVX512 有点像 AVX/AVX2 的超集,而 AVX/AVX2 可以看作是 SSE 的超集(事实上它不是,但 SSE 在 AVX 机器上始终可用,但不是反之亦然)。
不管你提到了 Haswell(AVX2 机器,所以 SSE 在船上,但这里自然没有 AVX512)和 Skylake(AVX512 机器,所以 AVX2 和 SSE 在船上)。因此,您可能需要像 -axCORE-AVX512 -xCORE-AVX2 这样的东西(在您的列表中没有低于 AVX2 的机器 - 即没有 SSE 或 AVX(1) 机器)。你好像只有 Skylake 服务器和 Haswell 服务器。
关于c - 不同架构的集群应该指定哪个AVX和march?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62215122/
我正在尝试在Elasticsearch中返回的值中考虑地理位置的接近性。我希望近距离比某些字段(例如legal_name)重要,但比其他字段重要。 从文档看来,当前的方法是使用distance_fea
我是Elasticsearch的初学者,今天在进行“多与或”查询时遇到问题。 我有一个SQL查询,需要在Elastic中进行转换: WHERE host_id = 999 AND psh_pid =
智能指针应该/可以在函数中通过引用传递吗? 即: void foo(const std::weak_ptr& x) 最佳答案 当然你可以通过const&传递一个智能指针。 这样做也是有原因的: 如果接
我想执行与以下MYSQL查询等效的查询 SELECT http_user, http_req_method, dst dst_port count(*) as total FROM my_table
我用这两个查询进行测试 用must查询 { "size": 200, "from": 0, "query": { "bool": { "must": [ { "mat
我仍在研究 Pro Android 2 的简短服务示例(第 304 页)同样,服务示例由两个类组成:如下所示的 BackgroundService.java 和如下所示的 MainActivity.j
给定标记 like this : header really_wide_table..........................................
根据 shouldJS 上的文档网站我应该能够做到这一点: ''.should.be.empty(); ChaiJS网站没有使用 should 语法的示例,但它列出了 expect 并且上面的示例似乎
我在 Stack Overflow 上读到一些 C 函数是“过时的”或“应该避免”。你能给我一些这种功能的例子以及原因吗? 这些功能有哪些替代方案? 我们可以安全地使用它们 - 有什么好的做法吗? 最
在 C++11 中,可变参数模板允许使用任意数量的参数和省略号运算符 ... 调用函数。允许该可变参数函数对每个参数做一些事情,即使每个参数的事情不是一样的: template void dummy(
我在我从事的项目之一上将Shoulda与Test::Unit结合使用。我遇到的问题是我最近更改了此设置: class MyModel :update end 以前,我的(通过)测试看起来像这样: c
我该如何做 or使用 chai.should 进行测试? 例如就像是 total.should.equal(4).or.equal(5) 或者 total.should.equal.any(4,5)
如果您要将存储库 B 中的更改 merge 到存储库 A 中,是否应该 merge .hgtags 中的更改? 存储库 B 可能具有 A 中没有的标签 1.01、1.02、1.03。为什么要将这些 m
我正在尝试执行X AND(y OR z)的查询 我需要获得该代理为上市代理或卖方的所有已售属性(property)。 我只用 bool(boolean) 值就可以得到9324个结果。当我添加 bool
我要离开 this教程,尝试使用 Mocha、Supertest 和 Should.js 进行测试。 我有以下基本测试来通过 PUT 创建用户接受 header 中数据的端点。 describe('U
我正在尝试为 Web 应用程序编写一些 UI 测试,但有一些复杂的问题希望您能帮助我解决。 首先,该应用程序有两种模式。其中一种模式是“训练”,另一种是“现场”。在实时模式下,数据直接从我们的数据库中
我有一个规范: require 'spec_helper' # hmm... I need to include it here because if I include it inside desc
我正在尝试用这个测试我在 Rails 中的更新操作: context "on PUT to :update" do setup do @countdown = Factory(:count
我还没有找到合适的答案: onclick="..." 中是否应该转义 &(& 符号)? (或者就此而言,在每个 HTML 属性中?) 我已经尝试在 jsFiddle 和 W3C 的验证器上运行转义和非
import java.applet.*; import java.awt.*; import java.awt.event.*; public class Main extends Applet i
我是一名优秀的程序员,十分优秀!