- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在 c 中编写了一个非常简单的 memset,它可以正常工作到 -O2 但不适用于 -O3 ...
memset :
void * memset(void * blk, int c, size_t n)
{
unsigned char * dst = blk;
while (n-- > 0)
*dst++ = (unsigned char)c;
return blk;
}
20000430 <memset>:
20000430: e3520000 cmp r2, #0 @ compare param 'n' with zero
20000434: 012fff1e bxeq lr @ if equal return to caller
20000438: e6ef1071 uxtb r1, r1 @ else zero extend (extract byte from) param 'c'
2000043c: e0802002 add r2, r0, r2 @ add pointer 'blk' to 'n'
20000440: e1a03000 mov r3, r0 @ move pointer 'blk' to r3
20000444: e4c31001 strb r1, [r3], #1 @ store value of 'c' to address of r3, increment r3 for next pass
20000448: e1530002 cmp r3, r2 @ compare current store address to calculated max address
2000044c: 1afffffc bne 20000444 <memset+0x14> @ if not equal store next byte
20000450: e12fff1e bx lr @ else back to caller
200005e4 <memset>:
200005e4: e3520000 cmp r2, #0 @ compare param 'n' with zero
200005e8: e92d4010 push {r4, lr} @ ? (1)
200005ec: e1a04000 mov r4, r0 @ move pointer 'blk' to r4 (temp to hold return value)
200005f0: 0a000001 beq 200005fc <memset+0x18> @ if equal (first line compare) jump to epilogue
200005f4: e6ef1071 uxtb r1, r1 @ zero extend (extract byte from) param 'c'
200005f8: ebfffff9 bl 200005e4 <memset> @ call myself ? (2)
200005fc: e1a00004 mov r0, r4 @ epilogue start. move return value to r0
20000600: e8bd8010 pop {r4, pc} @ restore r4 and back to caller
strb
,我无法弄清楚这个优化版本应该如何工作或类似。如果我尝试将内存设置为“0”或其他内容并不重要,因此该函数不仅会在 .bss(零初始化)变量上调用。
arm-none-eabi-gcc -O3 -Wall -Wextra -fPIC -nostdlib -nostartfiles -marm -fstrict-volatile-bitfields -march=armv7-a -mcpu=cortex-a9 -mfloat-abi=hard -mfpu=neon-vfpv3
最佳答案
你的第一个问题(1)。这是根据调用约定,如果您要进行嵌套函数调用,则需要保留链接寄存器,并且需要 64 位对齐。该代码使用 r4,因此保存了额外的寄存器。那里没有魔法。
你的第二个问题(2)它没有调用你的 memset 它正在优化你的代码,因为它认为它是一个低效的 memset。 Fuz 已经为您的问题提供了答案。
重命名函数
00000000 <xmemset>:
0: e3520000 cmp r2, #0
4: e92d4010 push {r4, lr}
8: e1a04000 mov r4, r0
c: 0a000001 beq 18 <xmemset+0x18>
10: e6ef1071 uxtb r1, r1
14: ebfffffe bl 0 <memset>
18: e1a00004 mov r0, r4
1c: e8bd8010 pop {r4, pc}
00000000 <xmemset>:
0: e3520000 cmp r2, #0
4: 012fff1e bxeq lr
8: e92d41f0 push {r4, r5, r6, r7, r8, lr}
c: e2426001 sub r6, r2, #1
10: e3560002 cmp r6, #2
14: e6efe071 uxtb lr, r1
18: 9a00002a bls c8 <xmemset+0xc8>
1c: e3a0c000 mov r12, #0
20: e3520023 cmp r2, #35 ; 0x23
24: e7c7c01e bfi r12, lr, #0, #8
28: e1a04122 lsr r4, r2, #2
2c: e7cfc41e bfi r12, lr, #8, #8
30: e7d7c81e bfi r12, lr, #16, #8
34: e7dfcc1e bfi r12, lr, #24, #8
38: 9a000024 bls d0 <xmemset+0xd0>
3c: e2445009 sub r5, r4, #9
40: e1a03000 mov r3, r0
44: e3c55007 bic r5, r5, #7
48: e3a07000 mov r7, #0
4c: e2851008 add r1, r5, #8
50: e1570005 cmp r7, r5
54: f5d3f0a0 pld [r3, #160] ; 0xa0
58: e1a08007 mov r8, r7
5c: e583c000 str r12, [r3]
60: e583c004 str r12, [r3, #4]
64: e2877008 add r7, r7, #8
68: e583c008 str r12, [r3, #8]
6c: e2833020 add r3, r3, #32
70: e503c014 str r12, [r3, #-20] ; 0xffffffec
74: e503c010 str r12, [r3, #-16]
78: e503c00c str r12, [r3, #-12]
7c: e503c008 str r12, [r3, #-8]
80: e503c004 str r12, [r3, #-4]
84: 1afffff1 bne 50 <xmemset+0x50>
88: e2811001 add r1, r1, #1
8c: e483c004 str r12, [r3], #4
90: e1540001 cmp r4, r1
94: 8afffffb bhi 88 <xmemset+0x88>
98: e3c23003 bic r3, r2, #3
9c: e1520003 cmp r2, r3
a0: e0466003 sub r6, r6, r3
a4: e0803003 add r3, r0, r3
a8: 08bd81f0 popeq {r4, r5, r6, r7, r8, pc}
ac: e3560000 cmp r6, #0
b0: e5c3e000 strb lr, [r3]
b4: 08bd81f0 popeq {r4, r5, r6, r7, r8, pc}
b8: e3560001 cmp r6, #1
bc: e5c3e001 strb lr, [r3, #1]
c0: 15c3e002 strbne lr, [r3, #2]
c4: e8bd81f0 pop {r4, r5, r6, r7, r8, pc}
c8: e1a03000 mov r3, r0
cc: eafffff6 b ac <xmemset+0xac>
d0: e1a03000 mov r3, r0
d4: e3a01000 mov r1, #0
d8: eaffffea b 88 <xmemset+0x88>
20000444: e4c31001 strb r1, [r3], #1 @ store value of 'c' to address of r3, increment r3 for next pass
20000448: e1530002 cmp r3, r2 @ compare current store address to calculated max address
2000044c: 1afffffc bne 20000444 <memset+0x14> @ if not equal store next byte
Compile with -fno-builtin-memset. The compiler recognises that the function implements memset and thus replaces it with a call to memset. You should in general compile with -ffreestanding when writing bare-metal code. I believe this fixes this sort of problem, too
关于c - 自己编写的简单 memset 不适用于 ARMv7 上的 -03 eabi gcc,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61866475/
在互联网上浏览代码时,我经常看到这样的片段: struct epoll_event event; memset(&event, 0, sizeof(event)); 如果事件填写完整,这种模式对我来说
我不认为我在这里理解了什么...... bool (*lookup)[100]; memset(lookup, 0, 100 * sizeof(*lookup)); 我正在尝试初始化一个指向堆栈分配数
我从以前退休的开发人员那里继承了一些代码。我的问题具体是在以下场景中使用 memset。不是 c 程序员,我想知道为什么在这种特殊情况下使用 memset,其中下一行代码将值存储在刚刚被 memset
如何在 jsctypes 中使用 memset。没有对应的 DLL。我搜索/搜索了 js ctype 代码,但找不到要破解的示例。 最佳答案 如果您只想将数组memset为零字节,那么我有“好消息,大
在尝试重新创建“memset”函数时,如果我尝试取消引用 void 指针,或者第二个参数的类型与第一个参数的类型不同,则会出现错误。为了使该功能正常工作,我必须将其更改为: void ft_memse
我关注了How to memset char array with null terminating character?在使用 C memset api 时添加空终止符。 代码有效;由于空终止符,我
这个问题在这里已经有了答案: Calloc with structure with pointers in C (3 个答案) 关闭 7 年前。 考虑以下对 void 指针数组的初始化: #incl
我写了这段代码: #include int main(void) { char c[10]=""; //Q if(c[2]=='\0')
我正在尝试为 2D 矩阵分配内存,但出现段错误。 int** inicializarMatriz(int **matriz, int vertices){ int i; matriz=(int**)
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
这给我带来了 memset 的段错误,我不知道为什么,我要访问 2D 数组的特定索引,这应该给我一个 char 指针并允许我使用 memeset。 void test(char** test) {
我正在尝试增长一个数组以添加新的 malloc 指针。 realloc 似乎并没有增加大小。另外,我一开始就为数组中的一个指针提供了足够的空间,因此即使 realloc 没有增加大小,我仍然希望能够复
我正在用 C 语言做一个关于 UDP 套接字的练习。当客户端发送特定消息(例如 hi)时,服务器必须发送“很高兴见到你”。如果没有找到标准回复,服务器将发送“没有合适的回复”。我的问题是memset如
由于memset采用字符串或数组的地址并将它们视为字符缓冲区。 它如何知道必须分配的给定值应该以 1 字节(字符)为一组还是以 4 字节为一组进行分配(整数)。 最佳答案 但事实并非如此。在第三个参数
我想避免使用memset()在这样的结构上: typedef struct { int size; float param1; } StructA; typedef struct {
我有以下一组代码,无法找到为什么我得到垃圾值。我的目的是将字节数复制为目标,而不考虑源,以便为我的应用程序制作通用副本。但没有得到正确的结果。有什么办法可以实现这一点。 int main() {
我定义了一个结构体,以及一个接受结构体指针并填充相关信息的函数,同时在开始时进行空检查。 粗略示例: typedef struct { int field; } myStruct; void my
我在编写一个函数来从文件中提取字符串作为更大程序的一部分时遇到一些问题。一切似乎都工作正常,除了当我使用 memset 或 bzero 来删除我一直在使用的字符数组时。我已经解决这个问题一个多小时了,
void readdat (int c, char **v) { char *dc; char *pdc; dc = malloc((line+1) * sizeof(char)); memset(d
我有一个指向数组的指针。我知道该数组可以容纳多少个项目,但每个项目的长度是动态的。那么在这种情况下如何memset()数组。 Int8 *data[4]; //array can hold maxim
我是一名优秀的程序员,十分优秀!