- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 Windows 10、Visual Studio 2019、平台:x64 并在单文件 Visual Studio 解决方案中具有以下测试脚本:
#include <iostream>
#include <intrin.h>
using namespace std;
int main() {
unsigned __int64 mask = 0x0fffffffffffffff; //1152921504606846975;
unsigned long index;
_BitScanReverse64(&index, mask);
if (index != 59) {
cout << "Fails!" << endl;
return EXIT_FAILURE;
}
else {
cout << "Success!" << endl;
return EXIT_SUCCESS;
}
}
在我的属性(property)解决方案中,我将“启用增强指令集”设置为“高级矢量扩展 2 (/arch:AVX2)”。使用 msvc 编译时(将“平台工具集”设置为“Visual Studio 2019 (v142)”)代码返回 EXIT_SUCCESS,但是使用 clang-cl 编译时(将“平台工具集”设置为“LLVM (clang-cl)”)我得到退出失败。在调试 clang-cl 运行时,index 的值为 4,而应为 59。这向我暗示 clang-cl 正在以与 MSVC 相反的方向读取位。
当我将“启用增强指令集”设置为“未设置”时,情况并非如此。在这种情况下,MSVC 和 clang-cl 都返回 EXIT_SUCCESS。
在所有情况下,调试输出窗口中加载和显示的所有 dll 都来自 C:\Windows\System32###.dll。
有人理解这种行为吗?如果有任何见解,我将不胜感激。
编辑:我之前没有提到:我用 IntelCore i7-3930K CPU @3.20GHz 编译了这个。
最佳答案
得到 4 而不是 59 听起来像 clang 将 _BitScanReverse64
实现为 63 - lzcnt
。实际的 bsr
在 AMD 上很慢,所以是的,编译器想要编译不同指令固有的 BSR 是有原因的。
但随后您在实际上不支持 BMI 的计算机上运行可执行文件,因此 lzcnt
被解码为 rep bsr
= bsr
,给出前导零计数而不是最高设置位的位索引。
据我所知,所有具有 AVX2 的 CPU 也具有 BMI。如果您的 CPU 没有它,您不应该期望使用 /arch:AVX2
构建的可执行文件能够在您的 CPU 上正确运行。在这种情况下,故障模式不是非法指令,它是 lzcnt
作为 bsr
运行。
MSVC 通常不会优化内部函数,显然包括这种情况,所以它只是直接使用 bsr
。
更新:i7-3930K是 SandyBridge-E。它没有 AVX2,所以这可以解释您的结果。
当您告诉它在非 AVX2 计算机上构建 AVX2 可执行文件时,clang-cl 不会出错。其用例是在一台机器上编译以创建可在不同机器上运行的可执行文件。
它也不会为您将 CPUID 检查代码添加到您的可执行文件中。如果你想要那个,你自己写吧。这是 C++,它不会牵着你的手。
MSVC 风格的 /arch
选项比普通的 GCC/clang 风格更受限制。没有像SSE4.1那样针对不同级别的SSE;它直接跳转到 AVX。
此外,/arch:AVX2
显然暗示 BMI1/2,即使它们是具有不同 CPUID 功能位的不同指令集。例如,在内核代码中,您可能需要整数 BMI 指令,而不是涉及 XMM/YMM 寄存器的 SIMD 指令。
clang -O3 -mavx2
不会同时启用 -mbmi
。您通常会希望这样做,但如果您未能同时启用 BMI,则 clang 将一直使用 bsr
。 (对于 Intel CPU,这实际上比 63-lzcnt
更好)。我认为 MSVC 的/arch:AVX2 类似于 -march=haswell
,如果它也启用 FMA 指令的话。
并且 MSVC 中的任何内容都不支持使二进制文件经过优化以在您构建它们的计算机上运行。这是有道理的,它是为软件开发的闭源二进制分发模型而设计的。
但是 GCC 和 clang 有 -march=native
来启用您的计算机支持的所有指令集。同样重要的是,设置适合您计算机的调整选项。例如不必担心编写在 AMD CPU 或较旧的 Intel 上运行缓慢的代码,只需编写适合您的 CPU 的 asm。
TL:DR:clang-cl 中的 CPU 选择选项非常粗糙,将非 SIMD 扩展与某种级别的 AVX 混为一谈。这就是为什么 /arch:AVX2
启用了整数 BMI 扩展,而 clang -mavx2
却没有。
关于visual-c++ - clang-cl 和 arch :avx2? 是否存在兼容性问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62493597/
这不是我的专业领域,所以我希望问的是正确的问题。 我们有一台滚动租用的服务器。旧服务器是32位windows服务器,新服务器是64位windows 2008 R2 SP1。 其中一个 Web 应用程序
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我已将 Oracle 数据库从 10g 迁移到 12c。从 12c 开始,oracle 不支持 PLSQL_V2_COMPATIBILITY 参数。 该参数用于: https://www.safari
开发环境db server为SqlServer 2005(开发版) 有什么方法可以确保我的 SQL 查询将在 SqlServer 2000 中运行? 此数据库设置为兼容级别“SQL Server 20
我有一个这种形式的类: public class Foo implements Serializable { private static final long serialVersionUI
我有以下代码来隐藏状态栏,取自 http://developer.android.com/training/system-ui/status.html和 Hide status bar android
我正在尝试测试 .prop() 是否方法存在于当前包含的 jQuery 中(出于兼容性原因): if(typeof $.prop === 'function') 我期望上面的条件是 true对于 jQ
当收到新消息时,我在项目中使用BroadcastChannel更改所有选项卡的标题。 问题在于它仅适用于chrome和firefox。因此,我决定使用localStorage创建一个Broadcast
我正在使用一个函数通过 FTP 将一个文件上传到我的服务器。这是我的代码并且工作正常但是创建的文件 example.json 不兼容 UTF8,因为它有 Atlético 而不是 Atlético 例
我正在使用兼容性类来构建用户代理字符串: public abstract class Compatibility { private static int sdkInt = 0; pr
我需要实现一个 C 例程来(解)压缩 gzip 格式的文件。 谁能举个例子? 我试过 zlib,但它似乎不兼容。 谢谢。 最佳答案 zlib 与 gzip 文件完全兼容,但您需要确保您使用的是面向 g
我正在使用以下 CSS 代码,它与 Chrome 完美兼容,但与 IE 浏览器不兼容 .collapse{ display:block; } .collapse + input[type="c
我的应用程序以 android Sdk 的 v10 为目标,但具有 minSdkVersion 的 v6。默认情况下,“match_parent”属性将用于宽度或高度。我应该为 fill_parent
我正在阅读有关 dynamic_cast 的内容,然后我遇到了以下语句 ( from cplusplus.com ): Compatibility note: This type of dynamic
我正在尝试在 Linux 下使用 QtCreator 构建一个用 VS 2008 编写的项目,但我遇到了很多错误: /home/ga/dev/CppGroup/MonteCarlo/main.cpp:
因此,我正在构建一个网站,用户可以在该网站上上传观看视频。我正在使用标准的 HTML5 视频播放器 ( ... )目前,我使用多个来源:MP4、OGG 和 WEBM,以实现跨浏览器兼容性 由于维护三
mozilla 和其他浏览器是否有类似-webkit-box-reflect 的属性?我无法在谷歌上找到哪些其他浏览器支持这个。因此,如果有人可以告诉我或给我链接,那就太好了。 最佳答案 这不仅可以使
我定义了一个自定义的 ValidateSet 参数属性,如下所示: Class MyValidValuesAttribute : System.Management.Automation.IValid
我使用 .net 4.0、linq 等编写 winforms 应用程序。它可以在带有 .net 2.0 的机器上运行吗? 最佳答案 不,不会。为 Framework 4.0 版编译的应用程序将要求该框
我如何专门检查 @keyframes translate3d 动画 与浏览器的兼容性? 请不要关闭这个问题,因为在问这个问题之前我已经尝试了很多 stackoverflow 解决方案。 我想检查我的网
我是一名优秀的程序员,十分优秀!