c - 为什么GCC在编译C代码时不使用更多寄存器-6ren

c - 为什么GCC在编译C代码时不使用更多寄存器

转载作者：行者123 更新时间：2023-11-30 21:46:18

在Ubuntu上使用ARM CPU的跨平台GCC编译C代码时，对于每条汇编指令，将从堆栈加载源数据并将结果写入堆栈。为什么GCC不使用更多的寄存器来减少加载/存储数据的时间？是不是因为ARM是load and store结构，GCC对每一条汇编指令的数据都会使用load/store的方式？

以下是我的冒泡排序函数:

bool bubble_sort(int* data, int dataSize) {
    int i;
    int j;
    int dataTmp;

    for(i=0; i<dataSize-1; i++) {
        for(j=0; j<dataSize-1; j++) {
            if(data[j] > data[j+1]) {
                dataTmp = data[j+1];
                data[j+1] = data[j];
                data[j] = dataTmp;
            }
        }
    }
    return true;
}

以下是上述C代码在Ubuntu上使用跨平台GCC工具编译的汇编代码:

00008d0c <bubble_sort>:
    8d0c:   e52db004    push    {fp}        ; (str fp, [sp, #-4]!)
    8d10:   e28db000    add fp, sp, #0
    8d14:   e24dd01c    sub sp, sp, #28
    8d18:   e50b0018    str r0, [fp, #-24]
    8d1c:   e50b101c    str r1, [fp, #-28]
    8d20:   e3a03000    mov r3, #0
    8d24:   e50b3010    str r3, [fp, #-16]
    8d28:   ea000032    b   8df8 <bubble_sort+0xec>
    8d2c:   e3a03000    mov r3, #0
    8d30:   e50b300c    str r3, [fp, #-12]
    8d34:   ea000027    b   8dd8 <bubble_sort+0xcc>
    8d38:   e51b300c    ldr r3, [fp, #-12]
    8d3c:   e1a03103    lsl r3, r3, #2
    8d40:   e51b2018    ldr r2, [fp, #-24]
    8d44:   e0823003    add r3, r2, r3
    8d48:   e5932000    ldr r2, [r3]
    8d4c:   e51b300c    ldr r3, [fp, #-12]
    8d50:   e2833001    add r3, r3, #1
    8d54:   e1a03103    lsl r3, r3, #2
    8d58:   e51b1018    ldr r1, [fp, #-24]
    8d5c:   e0813003    add r3, r1, r3
    8d60:   e5933000    ldr r3, [r3]
    8d64:   e1520003    cmp r2, r3
    8d68:   da000017    ble 8dcc <bubble_sort+0xc0>
    8d6c:   e51b300c    ldr r3, [fp, #-12]
    8d70:   e2833001    add r3, r3, #1
    8d74:   e1a03103    lsl r3, r3, #2
    8d78:   e51b2018    ldr r2, [fp, #-24]
    8d7c:   e0823003    add r3, r2, r3
    8d80:   e5933000    ldr r3, [r3]
    8d84:   e50b3008    str r3, [fp, #-8]
    8d88:   e51b300c    ldr r3, [fp, #-12]
    8d8c:   e2833001    add r3, r3, #1
    8d90:   e1a03103    lsl r3, r3, #2
    8d94:   e51b2018    ldr r2, [fp, #-24]
    8d98:   e0823003    add r3, r2, r3
    8d9c:   e51b200c    ldr r2, [fp, #-12]
    8da0:   e1a02102    lsl r2, r2, #2
    8da4:   e51b1018    ldr r1, [fp, #-24]
    8da8:   e0812002    add r2, r1, r2
    8dac:   e5922000    ldr r2, [r2]
    8db0:   e5832000    str r2, [r3]
    8db4:   e51b300c    ldr r3, [fp, #-12]
    8db8:   e1a03103    lsl r3, r3, #2
    8dbc:   e51b2018    ldr r2, [fp, #-24]
    8dc0:   e0823003    add r3, r2, r3
    8dc4:   e51b2008    ldr r2, [fp, #-8]
    8dc8:   e5832000    str r2, [r3]
    8dcc:   e51b300c    ldr r3, [fp, #-12]
    8dd0:   e2833001    add r3, r3, #1
    8dd4:   e50b300c    str r3, [fp, #-12]
    8dd8:   e51b301c    ldr r3, [fp, #-28]
    8ddc:   e2432001    sub r2, r3, #1
    8de0:   e51b300c    ldr r3, [fp, #-12]
    8de4:   e1520003    cmp r2, r3
    8de8:   caffffd2    bgt 8d38 <bubble_sort+0x2c>
    8dec:   e51b3010    ldr r3, [fp, #-16]
    8df0:   e2833001    add r3, r3, #1
    8df4:   e50b3010    str r3, [fp, #-16]
    8df8:   e51b301c    ldr r3, [fp, #-28]
    8dfc:   e2432001    sub r2, r3, #1
    8e00:   e51b3010    ldr r3, [fp, #-16]
    8e04:   e1520003    cmp r2, r3
    8e08:   caffffc7    bgt 8d2c <bubble_sort+0x20>
    8e0c:   e3a03001    mov r3, #1
    8e10:   e1a00003    mov r0, r3
    8e14:   e28bd000    add sp, fp, #0
    8e18:   e8bd0800    ldmfd   sp!, {fp}
    8e1c:   e12fff1e    bx  lr

以下是我使用内联汇编编写的代码，以使用更多寄存器来减少加载/存储时间:

void bubble_sort(int *data, int size) {
    //r2 = i
    //r3 = j
    asm volatile(
"       STMDB SP!, {r0-r7}  \n\t"
"                               "
"       SUB r1, r1, #1      \n\t" // r3 = size-1
"       LSL r1, r1, #2      \n\t" // int
"                               "
"       MOV r2, #0          \n\t" // r2 = i = 0
"                               "
"loop1:                     \n\t"
"       CMP r2, r1          \n\t" // r2 == r3: i == size-1
"       BEQ loop_end        \n\t"  
"                               "
"       MOV r3, #0          \n\t" // r3 = j = 1
"       MOV r4, r0          \n\t" // r4 = data
"       ADD r5, r4, #4      \n\t" // r5 = data + 4
"                               "
"loop2:                     \n\t"
"       CMP r3, r1          \n\t" // r3 == r1: j==size
"       BEQ loop1_end       \n\t"  
"                               "
"       LDR r6, [r4], #0    \n\t" //data[j-1]
"       LDR r7, [r5], #0    \n\t" //data[j]
"       CMP r6, r7          \n\t"
"       BLE incr_addr       \n\t"
"                               "
"       STR r6, [r5], #4    \n\t" //swp data, address + 4
"       STR r7, [r4], #4    \n\t"
"       B   loop2_end       \n\t"
"                               "
"incr_addr:                 \n\t"
"       ADD r4, r4, #4      \n\t" // r4 = r4 + 4
"       ADD r5, r5, #4      \n\t" // r5 = r5 + 4
"                               "
"loop2_end:                 \n\t"
"       ADD r3, r3, #4      \n\t"
"       B   loop2           \n\t"
"                               "
"loop1_end:                 \n\t"
"       ADD r2, r2, #4      \n\t"
"       B   loop1           \n\t"
"                               "
"loop_end:                  \n\t"
"                               "
"       LDMIA SP!,{r0-r7}       "
    );
    //back to caller
    //"      BX   lr              "
}

最佳答案

使用优化-O3，gcc将使用更多寄存器。

00008e10 <bubble_sort>:
    8e10:   e92d0030    push    {r4, r5}
    8e14:   e2414001    sub r4, r1, #1
    8e18:   e3540000    cmp r4, #0
    8e1c:   da00000d    ble 8e58 <bubble_sort+0x48>
    8e20:   e080c101    add ip, r0, r1, lsl #2
    8e24:   e2805004    add r5, r0, #4
    8e28:   e3a00000    mov r0, #0
    8e2c:   e1a03005    mov r3, r5
    8e30:   e5131004    ldr r1, [r3, #-4]
    8e34:   e4932004    ldr r2, [r3], #4
    8e38:   e1510002    cmp r1, r2
    8e3c:   c5031004    strgt   r1, [r3, #-4]
    8e40:   c5032008    strgt   r2, [r3, #-8]
    8e44:   e153000c    cmp r3, ip
    8e48:   1afffff8    bne 8e30 <bubble_sort+0x20>
    8e4c:   e2800001    add r0, r0, #1
    8e50:   e1500004    cmp r0, r4
    8e54:   1afffff4    bne 8e2c <bubble_sort+0x1c>
    8e58:   e3a00001    mov r0, #1
    8e5c:   e8bd0030    pop {r4, r5}
    8e60:   e12fff1e    bx  lr

关于c - 为什么GCC在编译C代码时不使用更多寄存器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31573651/

文章推荐： c - fork() 示例程序。需要解释

文章推荐： c - 下面的代码在 C 语言中是如何计算的？

文章推荐： python - 如何在python中使用struct/class的 vector

文章推荐： c++ - 学c++之前需要先学c吗？

java - 用于构建项目的库？我可以使用 C++ 编译 C++，或者使用 python 编译 java，或者使用 C++ 编译 java，等等？
是否有任何库或框架旨在促进从另一种成熟的编程语言中构建项目？在 C++、java 等编程语言中指定逻辑、集合和复杂规则非常容易，但在 Makefile 中完成这些事情似乎是一场艰苦的战斗。我还没有深
c++ - 代码可以用 clang 编译，但不能用 gcc 编译
我有这段代码可以用 clang 编译得很好(即使使用 -Weverything)，但是 gcc 会发出错误。 #include #include #include using namespace
c++ - C 头文件不能用 C 编译，但可以用 C++ 编译
我有以下 block 头文件 BKE_mesh.h: /* Connectivity data */ typedef struct IndexNode { struct IndexNode *
c++ - 如果使用 Makefile 编译，代码可以正常工作，如果使用 XCode 编译，代码会崩溃
我在我的一个项目中遇到了一个奇怪的问题。我的代码库依赖于一个外部库，其中包含一个名为 Dataset 的类. Dataset类私有(private)继承自 std::vector (其中 Sample
c++ - C/C++ 项目可以使用 Xcode 编译，但不能使用 gcc/g++ 编译
当使用 gcc、g++ 或 make 在终端中编译一个小型 C 或 C++ 项目时，我收到以下错误: /tmp/ccG1caGi.o: In function `main': main.c:(.tex
emacs - 如何在 Windows 上为 Emacs 23.1.50 编译 CEDET 1.0pre7 编译？
我正在尝试从 CVS 为 Windows 上的 Emacs 23.1.50 编译 CEDET，但在“第 6 步:打开 EDE...”时出现错误:“defvar:作为变量的符号值是无效的:cedet-m
c - fflush(stdin) 不能在 cygwin 中用 gcc 编译，但可以用 visual studio 2010 编译
我正在(重新)学习编程，我从 C 开始。我的 IDE(如果我可以这么说)是 Windows7 上的 cygwin(32 位)和 Visual-Studio 2010。我总是编译我用 gcc (cygw
C++ GCC 为什么这段 sfinae 代码可以用 GCC 4.7 编译，但不能用 4.8 编译？
我喜欢在模板类中使用本地类来执行类似“static if”的构造。但是我遇到了 gcc 4.8 不想编译我的代码的问题。但是 4.7 可以。这个例子: #include #include #in
Java - 使用 java 1.4 编译 src/main/java 并使用 1.5 编译 src/test/java
我有一个项目，必须仅使用 java 1.4 进行编译。但我计划使用mockito 编写一些单元测试。我想要一种在 pom 中指定的方法，以便 src/main/java 使用 jdk 1.4 编译，但
PHP 编译
我想了解 PHP 编译过程是如何工作的。假设我有一个名为funcs.php 的文件并且这个文件有三个函数，如果我include 或require 它，所有的在文件加载期间编译三个函数？或者源代码会被
gcc/g++编译
编译工具链我们写程序的时候用的都是集成开发环境 (IDE: Integrated Development Environment)，集成开发环境可以极大地方便我们程序员编写程序，但是配置起来
scala - 编译 for 循环时出现奇怪的错误
当我编写一些 Scala 代码时，在尝试编译代码时收到一条奇怪的错误消息。我将代码分解为一个更简单的代码(从语义的角度来看这完全没有意义，但仍然显示了错误)。 scala> :paste // Ent
带注释的 SASS 编译
我正在编译一个 SCSS 文件，它似乎删除了我的评论。我可以使用什么命令来保留所有评论？ >SASS input.scss output.css 我在 SCSS 中看到两种类型的注释。 // Comm
编译 C 结构
这是我的代码: #include typedef struct { const char *description; float value; int age; } swag
Grails GSP 编译？
当您编译 grails war 时，我知道 .groovy 代码被编译为字节码类文件，但我不明白容器(例如 tomcat)如何在请求 GSP 时知道如何编译它们。容器了解 GSP 吗？安装在服务器上的
编译 : undefined reference to
我正在努力将多个文件编译成一个通用程序。我收到一个错误: undefined reference to 'pi' 这是我的代码和 Makefile 的框架。我做错了什么？谢谢! 文件:calcPi.c
编译 LD_PRELOAD 包装器的冲突类型
我尝试使用 LD_PRELOAD 来 Hook sprintf function ，所以我将打印到缓冲区的结果: #define _GNU_SOURCE #include #include int
javascript - CoffeeScript 编译
我正在寻找最简单的方法来自动将 CoffeeScript 重新编译为 JS。阅读documentation但仍然很难得到我想要的东西。我需要它来监视文件夹 src/ 中的任何 *.coffee 文
javascript - CoffeeScript 编译
我想使用定制waveformjs 。我发现this on SO但是，我不知道如何编译/安装波形来开始。我从 GitHub 克隆它并进行了更改，但是我不知道如何将其转换为 .js 文件。最佳答案为了
java - 编译/捕获异常
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c - 为什么GCC在编译C代码时不使用更多寄存器