c++ - Visual Studio 2017 : _mm_load_ps often compiled to movups-6ren

c++ - Visual Studio 2017 : _mm_load_ps often compiled to movups

转载作者：塔克拉玛干更新时间：2023-11-03 00:23:15

25

4

我正在查看为我的代码生成的程序集(使用 Visual Studio 2017)并注意到 _mm_load_ps 经常(总是？)编译为 movups。

我使用 _mm_load_ps 的数据定义如下:

struct alignas(16) Vector {
    float v[4];
}

// often embedded in other structs like this
struct AABB {
    Vector min;
    Vector max;
    bool intersection(/* parameters */) const;
}

现在，当我使用这个构造时，会发生以下情况:

// this code
__mm128 bb_min = _mm_load_ps(min.v);

// generates this
movups  xmm4, XMMWORD PTR [r8]

由于 alignas(16)，我期待 movaps。在这种情况下，我是否需要其他东西来说服编译器使用 movaps？

编辑:我的问题不同于 this question因为我没有遇到任何崩溃。该结构是专门对齐的，我也在使用对齐分配。相反，我很好奇为什么编译器将 _mm_load_ps(对齐内存的内在函数)切换为 movups。如果我知道结构是在一个对齐的地址分配的，并且我通过这个*调用它，那么使用 movaps 是安全的，对吧？

最佳答案

在最新版本的 Visual Studio 和英特尔编译器(最近是 2013 年后？)中，编译器很少再生成对齐的 SIMD 加载/存储。

为 AVX 或更高版本编译时:

Microsoft 编译器(>VS2013？)不生成对齐加载。但它仍然会生成一致的商店。
Intel 编译器(> Parallel Studio 2012？)不再这样做了。但您仍会在 ICC 编译的二进制文件中看到它们，这些二进制文件位于它们的手动优化库中，例如 memset()。
从 GCC 6.1 开始，当您使用对齐的内部函数时，它仍然会生成对齐的加载/存储。

编译器被允许这样做，因为当代码编写正确时，它不会丢失功能。本地址对齐时，从 Nehalem 开始的所有处理器都不会因未对齐的加载/存储而受到惩罚。

微软在这个问题上的立场是“通过不崩溃来帮助程序员”。不幸的是，我无法再从 Microsoft 找到此声明的原始来源。在我看来，这恰恰相反，因为它隐藏了错位惩罚。从正确性的角度来看，它还隐藏了不正确的代码。

无论如何，无条件地使用未对齐的加载/存储确实可以稍微简化编译器。

新关联:

从 Parallel Studio 2018 开始，英特尔编译器根本不再生成对齐的移动 - 即使对于 Nehalem 之前的目标也是如此。
从 Visual Studio 2017 开始，Microsoft 编译器也不再生成对齐的移动 - 即使针对 AVX 之前的硬件也是如此。

这两种情况都会导致旧处理器不可避免的性能下降。但似乎 this is intentional因为英特尔和微软都不再关心旧处理器。

唯一不受此影响的加载/存储内在函数是非时间加载/存储。没有未对齐的等价物，因此编译器别无选择。

因此，如果您只想测试代码的正确性，您可以在加载/存储内在函数中替换非时态内在函数。但请注意不要让类似这样的东西进入生产代码，因为 NT 加载/存储(尤其是 NT 存储)是一把双刃剑，如果您不知道自己在做什么，它可能会伤到您。

关于c++ - Visual Studio 2017 : _mm_load_ps often compiled to movups，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42697118/

25

4

0

文章推荐： c - mmap 一个不太可能被程序的任何其他部分使用的地址

文章推荐： Linux qemu 重置寄存器

文章推荐： c++ - (&const_object) 可以评估为临时地址

sbt - sbt 可以将 "compile test:compile it:compile"作为单个命令执行吗，比如说 "*:compile"？
我在运行 compile test:compile it:compile经常并且...希望将击键次数减少到类似 *:compile 的数量。 .不过，它似乎不起作用。 $ sbt *:compile
compilation - CLJS : Hardcode the compilation date at compilation time
有人可以给我这个问题的提示(或整个解决方案!): 在 Clojurescript 项目中，如何自动将编译日期/时间硬编码在符号中，以便在使用应用程序时显示？谢谢。最佳答案有多种解决方案: 使用l
javascript - 未捕获错误 : Cannot call `compile` without the template compiler loaded. 请在调用 `ember-template-compiler.js` 之前加载 `compile`
我是 ember.js 框架的新手，使用 ruby on rails 和 ember.debug.js -v 1.10.1(最新版本)。我一直在网上看到 ember 更改了这个最新的补丁，但我不知
fortran - F77 : problem to compile with g77 a program which was normally compiled with Absoft compiler
我不是 Fortran 程序员(只是短暂的经验)，但我需要编译一个部分用 F77 编写的程序。在我之前有人用 Absoft 编译器编译过它，但现在我需要在另一台机器上用 g77 重复这个过程。对于 A
java - 无法执行目标 org.apache.maven.plugins :maven-compiler-plugin:3. 8.1:compile (default-compile) on project fhirql: Fatal error compiler
我运行命令 mvn clean package 我得到了上面的错误我的 pom 是: http://maven.apache.org/xsd/maven-4.0.0.xsd"> 4.0.0
compilation - maven-compiler-plugin排除
我有以下问题。我想在测试编译阶段排除一些.java文件（** / jsfunit / *。java），另一方面，我想在编译阶段包括它们（id我使用tomcat启动tomcat：运行目标））我的p
compiler-construction - 你什么时候可以声称你的程序是 "compiler"？
符合 wikipedia A compiler is a computer program (or set of programs) that transforms source code writt
maven - 无法执行目标 org.apache.maven.plugins :maven-compiler-plugin:3. 8.1:compile (default-compile): Fatal error compiling: invalid target release: 11
我想构建项目，但出现如下错误: 无法执行目标 org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile
java - Spring 工具套件中的 maven-compiler-plugin :3. 7.0:compile (default-compile)
当我通过右键单击项目名称进行 Maven 安装时，出现以下错误: [INFO] Scanning for projects... [WARNING] [WARNING] Some proble
java - 无法在项目上执行目标 org.apache.maven.plugins :maven-compiler-plugin:3. 3:compile (default-compile)
我是 Maven 的新手，我想将我的应用程序导入到 Maven。和以前一样，我想将我的 ejb 项目中的类引用到我的 war 项目中。我在类中没有错误，但是如果我在我的父项目上安装 maven，那么我
asp.net - system.web.compilation.debug vs. system.codedom.compilers.compiler.compilerOptions/define :Debug=True
当我将 ASP.NET Web 应用程序部署到生产环境时，我使用配置转换来删除 debug="true"来自 .但是，就在今天，我注意到 web.config 中的另一个部分如下所示:
java - 无法执行目标org.apache.maven.plugins :maven-compiler-plugin:3.1:compile (default-compile) on project [duplicate]
This question already has answers here: Maven Compilation Error: (use -source 7 or higher to enable
java - 无法执行目标 org.apache.maven.plugins :maven-compiler-plugin:2. 3.2:compile (default-compile)
我正在使用 Maven 3.0.5 和 Spring Tool Source 3.2 并安装了 Maven 插件。当我尝试执行“运行方式---> Maven 安装”时，出现以下错误: [INFO] S
AngularJS:通过递归指令手动 $compile 与自然 $compile
我试图用 AngularJS 创建我自己的递归指令，它调用自己以漂亮的 JSON 格式转换 View 中的对象。好吧，首先我使用 ng-include 调用带有模板的脚本，在其中使用 ng-if 验证
compiler-construction - 如何使用Closure Compiler @suppress多个警告？
可以通过 @suppress annotation使用Google的Closure Compiler在每个文件的基础上禁止显示警告。但是，似乎无法同时抑制多个警告-例如globalThis和check
compiler-construction - 更难构建 : Emulator or compiler?
假设一个拥有 10 到 20 年经验的熟练开发人员从未构建过编译器或模拟器，哪一个会更具挑战性？你能比较一下会成为障碍的问题吗？谢谢。最佳答案仿真和编译是完全不同的，但由于两者都被认为是“低级
compilation - :compiler command do in Vim? 是什么意思
最近发现Vim中有一个命令叫compiler。您可以使用任何常见的编译器(例如，:compiler gcc、:compiler php 等)来调用它，但它似乎没有任何立竿见影的效果。我在联机帮助页上
spring - 无法执行目标 org.maven.plugins :maven-compiler-plugin:3. 8.1:compile (default-compile) on project (target 11)
我试图从 spring.io 指南中部署最简单的应用程序 Guide 但是我有一些麻烦.. 我做了什么: 创建的项目。 (来自 spring.io 教程) 下载 heroku CLI 在 Intell
java - "Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile)"
每当进行 Maven Build..>clean install 时，我都会遇到此错误。我尝试过使用不同版本的插件并添加 testFailureIgnore 属性，但问题仍然存在。请找到下面的 POM
java - 无法在项目 produit-webapp 上执行目标 org.apache.maven.plugins :maven-compiler-plugin:3. 1:compile (default-compile)
我有一个 web 应用程序，我尝试使用 maven 进行编译，不幸的是，在执行 mvn clean package 时它不起作用。 stackoverflow 上有很多问题看起来都一样，但没有解决了我

首页

博学

6Ren·AI

商城

c++ - Visual Studio 2017 : _mm_load_ps often compiled to movups