c - 如何防止使用 arm-none-eabi-gcc 编译器对该函数进行 vector 运算优化？

转载作者：太空宇宙更新时间：2023-11-04 07:54:40

27

4

我的代码

我正在使用一个在学术项目中使用此函数的简单代码:

void calculateDistanceMatrix(const float data[M][N],
                             float distance[M][N]) {
    float sum = 0.0;
    for(int i = 0; i < M; i++) {
        for(int j = i+1; j < M; j++) {
            for(int k = 0; k < N; w++) {
                sum += (data[i][k] - data[j][k]) *
                       (data[i][k] - data[j][k]);
            }
            distance[i][j] = sum;
            distance[j][i] = sum;
            distance[i][i] = 0.0;
            sum = 0.0;
        }
    }
}

我的目标架构

我的代码应该只对“数据”执行这个简单的矩阵运算，并用结果填充“距离”矩阵。然而，在我的学术项目中，我对编译器如何为我正在使用的 ARM 架构优化这些 vector 操作感兴趣。编译的命令行包含以下内容:

arm-none-eabi-gcc <flags> <my_sources> -mcpu=cortex-a9 -mfpu=vfpv3 -mfloat-abi=hard <more_flags>

我的程序旨在在嵌入式 Xilinx Zynq-7000 设备中运行，其架构包括用于 vector 操作的 NEON 优化指令集(在 this nice presentation 中描述)

我的问题

我必须在使用和不使用编译器优化的情况下跟踪“calculateDistanceMatrix”函数中 vector 运算的执行性能。我注意到程序集输出包括用于 vector 加载和存储操作的共享 NEON 和 VFP 指令(详见 ARM's Assembler Reference for Version 5.0 ):

ecf37a01    vldmia  r3!, {s15}
ecf26a01    vldmia  r2!, {s13}
e1530000    cmp r3, r0
ee777ae6    vsub.f32    s15, s15, s13
ee077aa7    vmla.f32    s14, s15, s15
1afffff9    bne 68 <calculateDistanceMatrix+0x48>
eca17a01    vstmia  r1!, {s14}

我找不到一种方法来编译此代码，以便不使用这些优化指令。

您知道可以避免这些指令的任何编译配置或代码技巧吗？感谢在此问题上的任何帮助。

最佳答案

您引用的指令不是 vector 运算:vsub.f32 s15、s13、s15这是一个简单的 32 位浮点减法。你可以通过使用32位形式的S寄存器和指令中的.f32后缀来判断

关于c - 如何防止使用 arm-none-eabi-gcc 编译器对该函数进行 vector 运算优化？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50995363/

27

4

0

文章推荐： Python:从具有所需模块的 .py 文件导入函数

文章推荐： java - 如何在 eclipse rcp 中编辑 workbench.xml 特定节点的值

文章推荐： java - 将 Tomcat 7 jndi 中资源的查找集中在单个类中

linux - 如何找到 GCC 支持的所有 EABI 版本以及如何找到目标系统的 EABI 版本？
这里有两个问题: 将共享库移植到许多 Linux-or-Android-on-ARM 系统时，需要知道 GCC 交叉编译器支持的确切 EABI 版本以及默认的 EABI 版本。怎么做？如何调查哪个
c++ - 链接成功与 arm-none-eabi-g++ 但不是 arm-none-eabi-gcc
我正在使用 Launchpad Arm 编译器工具。具体来说， arm-none-eabi-g++ 和 arm-none-eabi-gcc 来自: (ARM 嵌入式处理器的 GNU 工具)5.2.1
无法使预编译头与arm-none-eabi-gcc一起工作
我正在使用下面的 gcc 工具链。gcc 版本 5.4.1 20160919(发布)[ARM/embedded-5-branch 修订版 240496](用于 ARM 嵌入式处理器的 GNU 工具)
使用arm-none-eabi-gcc和bool变量的编译器错误
我正在尝试使用arm-none-eabi-gcc为STM32编译一个USB环回示例，但遇到了bool变量的编译器错误。错误为错误:“_Bool”之前应有“;”、标识符或“(”，违规行为 typedef
android - 在包更新期间，EABI 库是否会使用主要支持的架构进行更新？
如果一个 Android 应用程序最初只支持 armeabi-v7a 和 x86，并且在未来它增加了对 arm64-v8a 的支持，设备(主要和次要 ABI 分别是 arm64-v8a 和 armea
android - 关于arm-eabi-gcc和交叉编译
我有一个复杂的开源库需要移植到安卓NDK。首先，我需要配置 (./Configure)。我明白:我必须使用/home/user/android-ndk/build/prebuilt/进行交叉编译lin
android - ARM EABI v7a系统镜像在android中有什么用？
我们在Android开发中需要ARM EABI v7a系统镜像做什么？该特定图像的目的是什么？最佳答案如果您使用 NativeDK，没有该图像，模拟器将无法模拟 ARMv7 代码的执行(如多核指令
c - 如何编译交叉编译器arm-linux-eabi-gcc？
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便
c - 如何执行使用arm-none-eabi-gcc编译的文件
我在 Linux 机器上用 C 语言编写了一个 hello world 程序。编译是使用工具链 arm-none-eabi-gcc 完成的(稍后我将使用它进行交叉编译)。但我想在进一步推进之前在同一台
使用 arm-eabi-gcc 交叉编译模块
我有一个视频模块，我正在使用 arm-eabi-gcc 交叉编译器进行编译。我使用以下命令进行编译$ arm-eabi-gcc -O2 -DMODULE -D__KERNEL__ -W -Wall -
c++ - arm-eabi-addr2line 不显示行号
我正在为我的 Android 项目运行 arm-eabi-addr2line，我的命令是 /Applications/android-sdk-mac_86/android-ndk-r5b/toolch
linux - arm-none-eabi 命令将无法正确安装
我正在尝试在树莓派上安装用于汇编代码的工具链。我使用以下过程来安装包文件: $ wget http://www.cl.cam.ac.uk/freshers/raspberrypi/tutorials/
c++ - 未知的 EABI 对象属性 44
我正在通过 arm-unknown-linux-gnueabi 交叉编译我的代码，在编译期间可以看到很多以下警告 Unknown EABI object attribute 44 上面的警告是可以忽略
使用arm-none-eabi-gcc编译和链接库liba.a报错
我正在 64 位 Linux 机器上用 C 编译一个 hello world 程序。我正在使用 GCC ARM 嵌入式工具链在配备 ATMEL AT91SAM9G20 处理器的 FOX G20 V 板
arm - arm-eabi-gcc和arm-elf-gcc有什么区别？
arm-eabi-gcc和arm-elf-gcc有什么区别？他们可以为cortex-m3 arch编译相同的源代码吗？最佳答案 arm-elf-gcc是支持旧版浮点加速器(FPA)和混合字节序浮点
arm - ARM ABI 和 EABI 的目的是什么？
我越看这个 PDF ( Application Binary Interface forthe ARM Architecture: The Base Standard )，我就越不明白它的意思。我还想
c++ - arm-none-eabi-g++:没有这样的文件或目录
我正在尝试将“眨眼”示例上载到我的MKR1000。但是，我一直收到相同的错误: fork/exec /Users/username/Library/Arduino15/packages/arduino
c - 如何在arm-none-eabi-gcc中指定Cortex-A53？
我正在尝试在minGW中使用arm-none-eabi-gcc编译HELLOWORLD.c，命令如下: D:\code>arm-none-eabi-gcc hello.c -o hello -shar
c - STM32F0使用GCC编程arm-none-eabi : hardfault in __libc_init_array
我正在尝试为 STM32L030x6 MCU 制作固件。我编写了一个简单的代码，似乎可以在具有 STM32L030x8 MCU 的评估板上运行。我所说的“似乎有效”是指我能够访问主 fct 并切换
c - 在arm-none-eabi-gcc中找不到inttypes.h
我在库中有一个头文件，其中包括 inttypes.h (使用 PRIu8 等所需)。我将库头文件包含到我自己的应用程序文件中。当我尝试在lpcxpresso(基于eclipse)中使用arm-non

首页

博学

6Ren·AI

商城

c - 如何防止使用 arm-none-eabi-gcc 编译器对该函数进行 vector 运算优化？

我的代码

我的目标架构

我的问题