- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在Ubuntu上使用ARM CPU的跨平台GCC编译C代码时,对于每条汇编指令,将从堆栈加载源数据并将结果写入堆栈。为什么GCC不使用更多的寄存器来减少加载/存储数据的时间?是不是因为ARM是load and store结构,GCC对每一条汇编指令的数据都会使用load/store的方式?
以下是我的冒泡排序函数:
bool bubble_sort(int* data, int dataSize) {
int i;
int j;
int dataTmp;
for(i=0; i<dataSize-1; i++) {
for(j=0; j<dataSize-1; j++) {
if(data[j] > data[j+1]) {
dataTmp = data[j+1];
data[j+1] = data[j];
data[j] = dataTmp;
}
}
}
return true;
}
以下是上述C代码在Ubuntu上使用跨平台GCC工具编译的汇编代码:
00008d0c <bubble_sort>:
8d0c: e52db004 push {fp} ; (str fp, [sp, #-4]!)
8d10: e28db000 add fp, sp, #0
8d14: e24dd01c sub sp, sp, #28
8d18: e50b0018 str r0, [fp, #-24]
8d1c: e50b101c str r1, [fp, #-28]
8d20: e3a03000 mov r3, #0
8d24: e50b3010 str r3, [fp, #-16]
8d28: ea000032 b 8df8 <bubble_sort+0xec>
8d2c: e3a03000 mov r3, #0
8d30: e50b300c str r3, [fp, #-12]
8d34: ea000027 b 8dd8 <bubble_sort+0xcc>
8d38: e51b300c ldr r3, [fp, #-12]
8d3c: e1a03103 lsl r3, r3, #2
8d40: e51b2018 ldr r2, [fp, #-24]
8d44: e0823003 add r3, r2, r3
8d48: e5932000 ldr r2, [r3]
8d4c: e51b300c ldr r3, [fp, #-12]
8d50: e2833001 add r3, r3, #1
8d54: e1a03103 lsl r3, r3, #2
8d58: e51b1018 ldr r1, [fp, #-24]
8d5c: e0813003 add r3, r1, r3
8d60: e5933000 ldr r3, [r3]
8d64: e1520003 cmp r2, r3
8d68: da000017 ble 8dcc <bubble_sort+0xc0>
8d6c: e51b300c ldr r3, [fp, #-12]
8d70: e2833001 add r3, r3, #1
8d74: e1a03103 lsl r3, r3, #2
8d78: e51b2018 ldr r2, [fp, #-24]
8d7c: e0823003 add r3, r2, r3
8d80: e5933000 ldr r3, [r3]
8d84: e50b3008 str r3, [fp, #-8]
8d88: e51b300c ldr r3, [fp, #-12]
8d8c: e2833001 add r3, r3, #1
8d90: e1a03103 lsl r3, r3, #2
8d94: e51b2018 ldr r2, [fp, #-24]
8d98: e0823003 add r3, r2, r3
8d9c: e51b200c ldr r2, [fp, #-12]
8da0: e1a02102 lsl r2, r2, #2
8da4: e51b1018 ldr r1, [fp, #-24]
8da8: e0812002 add r2, r1, r2
8dac: e5922000 ldr r2, [r2]
8db0: e5832000 str r2, [r3]
8db4: e51b300c ldr r3, [fp, #-12]
8db8: e1a03103 lsl r3, r3, #2
8dbc: e51b2018 ldr r2, [fp, #-24]
8dc0: e0823003 add r3, r2, r3
8dc4: e51b2008 ldr r2, [fp, #-8]
8dc8: e5832000 str r2, [r3]
8dcc: e51b300c ldr r3, [fp, #-12]
8dd0: e2833001 add r3, r3, #1
8dd4: e50b300c str r3, [fp, #-12]
8dd8: e51b301c ldr r3, [fp, #-28]
8ddc: e2432001 sub r2, r3, #1
8de0: e51b300c ldr r3, [fp, #-12]
8de4: e1520003 cmp r2, r3
8de8: caffffd2 bgt 8d38 <bubble_sort+0x2c>
8dec: e51b3010 ldr r3, [fp, #-16]
8df0: e2833001 add r3, r3, #1
8df4: e50b3010 str r3, [fp, #-16]
8df8: e51b301c ldr r3, [fp, #-28]
8dfc: e2432001 sub r2, r3, #1
8e00: e51b3010 ldr r3, [fp, #-16]
8e04: e1520003 cmp r2, r3
8e08: caffffc7 bgt 8d2c <bubble_sort+0x20>
8e0c: e3a03001 mov r3, #1
8e10: e1a00003 mov r0, r3
8e14: e28bd000 add sp, fp, #0
8e18: e8bd0800 ldmfd sp!, {fp}
8e1c: e12fff1e bx lr
以下是我使用内联汇编编写的代码,以使用更多寄存器来减少加载/存储时间:
void bubble_sort(int *data, int size) {
//r2 = i
//r3 = j
asm volatile(
" STMDB SP!, {r0-r7} \n\t"
" "
" SUB r1, r1, #1 \n\t" // r3 = size-1
" LSL r1, r1, #2 \n\t" // int
" "
" MOV r2, #0 \n\t" // r2 = i = 0
" "
"loop1: \n\t"
" CMP r2, r1 \n\t" // r2 == r3: i == size-1
" BEQ loop_end \n\t"
" "
" MOV r3, #0 \n\t" // r3 = j = 1
" MOV r4, r0 \n\t" // r4 = data
" ADD r5, r4, #4 \n\t" // r5 = data + 4
" "
"loop2: \n\t"
" CMP r3, r1 \n\t" // r3 == r1: j==size
" BEQ loop1_end \n\t"
" "
" LDR r6, [r4], #0 \n\t" //data[j-1]
" LDR r7, [r5], #0 \n\t" //data[j]
" CMP r6, r7 \n\t"
" BLE incr_addr \n\t"
" "
" STR r6, [r5], #4 \n\t" //swp data, address + 4
" STR r7, [r4], #4 \n\t"
" B loop2_end \n\t"
" "
"incr_addr: \n\t"
" ADD r4, r4, #4 \n\t" // r4 = r4 + 4
" ADD r5, r5, #4 \n\t" // r5 = r5 + 4
" "
"loop2_end: \n\t"
" ADD r3, r3, #4 \n\t"
" B loop2 \n\t"
" "
"loop1_end: \n\t"
" ADD r2, r2, #4 \n\t"
" B loop1 \n\t"
" "
"loop_end: \n\t"
" "
" LDMIA SP!,{r0-r7} "
);
//back to caller
//" BX lr "
}
最佳答案
使用优化-O3,gcc将使用更多寄存器。
00008e10 <bubble_sort>:
8e10: e92d0030 push {r4, r5}
8e14: e2414001 sub r4, r1, #1
8e18: e3540000 cmp r4, #0
8e1c: da00000d ble 8e58 <bubble_sort+0x48>
8e20: e080c101 add ip, r0, r1, lsl #2
8e24: e2805004 add r5, r0, #4
8e28: e3a00000 mov r0, #0
8e2c: e1a03005 mov r3, r5
8e30: e5131004 ldr r1, [r3, #-4]
8e34: e4932004 ldr r2, [r3], #4
8e38: e1510002 cmp r1, r2
8e3c: c5031004 strgt r1, [r3, #-4]
8e40: c5032008 strgt r2, [r3, #-8]
8e44: e153000c cmp r3, ip
8e48: 1afffff8 bne 8e30 <bubble_sort+0x20>
8e4c: e2800001 add r0, r0, #1
8e50: e1500004 cmp r0, r4
8e54: 1afffff4 bne 8e2c <bubble_sort+0x1c>
8e58: e3a00001 mov r0, #1
8e5c: e8bd0030 pop {r4, r5}
8e60: e12fff1e bx lr
关于c - 为什么GCC在编译C代码时不使用更多寄存器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31573651/
是否有任何库或框架旨在促进从另一种成熟的编程语言中构建项目? 在 C++、java 等编程语言中指定逻辑、集合和复杂规则非常容易,但在 Makefile 中完成这些事情似乎是一场艰苦的战斗。我还没有深
我有这段代码可以用 clang 编译得很好(即使使用 -Weverything),但是 gcc 会发出错误。 #include #include #include using namespace
我有以下 block 头文件 BKE_mesh.h: /* Connectivity data */ typedef struct IndexNode { struct IndexNode *
我在我的一个项目中遇到了一个奇怪的问题。我的代码库依赖于一个外部库,其中包含一个名为 Dataset 的类. Dataset类私有(private)继承自 std::vector (其中 Sample
当使用 gcc、g++ 或 make 在终端中编译一个小型 C 或 C++ 项目时,我收到以下错误: /tmp/ccG1caGi.o: In function `main': main.c:(.tex
我正在尝试从 CVS 为 Windows 上的 Emacs 23.1.50 编译 CEDET,但在“第 6 步:打开 EDE...”时出现错误:“defvar:作为变量的符号值是无效的:cedet-m
我正在(重新)学习编程,我从 C 开始。我的 IDE(如果我可以这么说)是 Windows7 上的 cygwin(32 位)和 Visual-Studio 2010。我总是编译我用 gcc (cygw
我喜欢在模板类中使用本地类来执行类似“static if”的构造。但是我遇到了 gcc 4.8 不想编译我的代码的问题。但是 4.7 可以。 这个例子: #include #include #in
我有一个项目,必须仅使用 java 1.4 进行编译。但我计划使用mockito 编写一些单元测试。我想要一种在 pom 中指定的方法,以便 src/main/java 使用 jdk 1.4 编译,但
我想了解 PHP 编译过程是如何工作的。 假设我有一个名为funcs.php 的文件并且这个文件有三个函数,如果我include 或require 它,所有的在文件加载期间编译三个函数?或者源代码会被
编译工具链 我们写程序的时候用的都是集成开发环境 (IDE: Integrated Development Environment),集成开发环境可以极大地方便我们程序员编写程序,但是配置起来
当我编写一些 Scala 代码时,在尝试编译代码时收到一条奇怪的错误消息。我将代码分解为一个更简单的代码(从语义的角度来看这完全没有意义,但仍然显示了错误)。 scala> :paste // Ent
我正在编译一个 SCSS 文件,它似乎删除了我的评论。我可以使用什么命令来保留所有评论? >SASS input.scss output.css 我在 SCSS 中看到两种类型的注释。 // Comm
这是我的代码: #include typedef struct { const char *description; float value; int age; } swag
当您编译 grails war 时,我知道 .groovy 代码被编译为字节码类文件,但我不明白容器(例如 tomcat)如何在请求 GSP 时知道如何编译它们。容器了解 GSP 吗?安装在服务器上的
我正在努力将多个文件编译成一个通用程序。我收到一个错误: undefined reference to 'pi' 这是我的代码和 Makefile 的框架。我做错了什么?谢谢! 文件:calcPi.c
我尝试使用 LD_PRELOAD 来 Hook sprintf function ,所以我将打印到缓冲区的结果: #define _GNU_SOURCE #include #include int
我正在寻找最简单的方法来自动将 CoffeeScript 重新编译为 JS。 阅读documentation但仍然很难得到我想要的东西。 我需要它来监视文件夹 src/ 中的任何 *.coffee 文
我想使用定制waveformjs 。我发现this on SO但是,我不知道如何编译/安装波形来开始。我从 GitHub 克隆它并进行了更改,但是我不知道如何将其转换为 .js 文件。 最佳答案 为了
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我是一名优秀的程序员,十分优秀!