- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
当尝试处理 uint64
中的单个字节时,AVR gcc⁽¹⁾ 给我一个奇怪的序言/结尾,而使用 uint32_t
编写的相同函数给了我一个单个 ret
(示例函数是 NOP)。
为什么 gcc 这样做?我该如何删除它?
You can see the code here, in Compiler Explorer .
⁽¹⁾ 来自 Arduino 1.8.9 发行版的 gcc 5.4.0,参数 =-O3 -std=c++11
。
源代码:
#include <stdint.h>
uint32_t f_u32(uint32_t x) {
union y {
uint8_t p[4];
uint32_t w;
};
return y{ .p = {
y{ .w = x }.p[0],
y{ .w = x }.p[1],
y{ .w = x }.p[2],
y{ .w = x }.p[3]
} }.w;
}
uint64_t f_u64(uint64_t x) {
union y {
uint8_t p[8];
uint64_t w;
};
return y{ .p = {
y{ .w = x }.p[0],
y{ .w = x }.p[1],
y{ .w = x }.p[2],
y{ .w = x }.p[3],
y{ .w = x }.p[4],
y{ .w = x }.p[5],
y{ .w = x }.p[6],
y{ .w = x }.p[7]
} }.w;
}
为 uint32_t
版本生成的程序集:
f_u32(unsigned long):
ret
为 uint64_t
版本生成的程序集:
f_u64(unsigned long long):
push r28
push r29
in r28,__SP_L__
in r29,__SP_H__
subi r28,72
sbc r29,__zero_reg__
in __tmp_reg__,__SREG__
cli
out __SP_H__,r29
out __SREG__,__tmp_reg__
out __SP_L__,r28
subi r28,-72
sbci r29,-1
in __tmp_reg__,__SREG__
cli
out __SP_H__,r29
out __SREG__,__tmp_reg__
out __SP_L__,r28
pop r29
pop r28
ret
最佳答案
我不确定这是否是一个好的答案,但这是我能给出的最好答案。 f_u64()
函数的程序集在堆栈上分配 72 个字节,然后再次释放它们(因为这涉及寄存器 r28
和 r29
,它们开始保存,最后恢复)。
如果您尝试在没有优化的情况下进行编译(我也跳过了 c++11
标志,我认为这没有任何区别),那么您将看到 f_u64()
函数首先在堆栈上分配 80 个字节(类似于您在优化代码中看到的开头语句,只是使用 80 个字节而不是 72 个字节):
in r28,__SP_L__
in r29,__SP_H__
subi r28,80
sbc r29,__zero_reg__
in __tmp_reg__,__SREG__
cli
out __SP_H__,r29
out __SREG__,__tmp_reg__
out __SP_L__,r28
这80个字节其实都用上了。首先存储参数 x
的值(8 个字节),然后进行涉及剩余 72 个字节的大量移动数据。
之后这 80 个字节被释放到堆栈上,类似于优化代码中的关闭语句:
subi r28,-80
sbci r29,-1
in __tmp_reg__,__SREG__
cli
out __SP_H__,r29
out __SREG__,__tmp_reg__
out __SP_L__,r28
我的猜测是优化器认为可以节省用于存储参数的 8 个字节。因此它只需要 72 个字节。然后它得出结论,所有数据的移动都可以幸免。然而,它没有弄清楚这意味着堆栈上的72字节可以被节省下来。
因此,我最好的选择是这是优化器中的限制或错误(无论您喜欢如何调用它)。在这种情况下,唯一的“解决方案”是尝试打乱真正的代码以找到解决方法或将其作为编译器错误引发。
关于c++ - avr-gcc:(看似)简单功能中不需要的序言/结尾,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57780290/
我在将两个“相同”字符串转换为大写时遇到了一个非常奇怪的问题。该程序正在从网站读取行并将其与存储在文本文件中的行进行比较。如果未找到该行,则将其添加到文件末尾。除非该行包含特殊字符,否则这非常有效。由
我见过对象创建的各种模式,但在深入研究 Firefox 框架 Javascript 后,我注意到他们使用的是我以前从未见过的约定,我希望这里有人可以确认我的假设或纠正我: 在构建类时,我过去曾这样
多亏了我在 Oxfam 书店找到的一本小书和一本大书,我一直在研究 C、C++ 和 Allegro。我现在理解得很好,但我遇到了困难……每当我编译时,我都会遇到这些错误: archiboldian@a
也许标题可以改写得稍微好一点,但基本上我想知道 facebook 之类的公司如何实现关于新通知/消息等的“实时”界面。我知道这样一个社交网络背后的复杂性太在这个小的 SO 线程中有很多讨论,但如果有人
我想使用 R 的 C 接口(interface)编写一个 R 函数,该函数采用 2 列递增的非重叠整数间隔矩阵,并返回一个包含这些间隔加上一些附加间隔的列表,这样就没有间隙。例如,它应该取矩阵 rbi
我们的崩溃日志系统显示崩溃,我不明白它是如何发生的。用户输入未知。我已添加日志记录,但结果只有在下一个版本(约 2 周)后才能看到。 下面的代码如何抛出下一个异常: Crashes with java
我正在java1.7下使用JavaFX进行编程,除了这部分之外,所有内容都适用于我的代码。问题是,只有最终结果被写出来。当程序运行时,我希望它在标签中显示“Ping 测试正在运行”文本。但它不会这样做
已关闭。这个问题是 not reproducible or was caused by typos 。目前不接受答案。 这个问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-top
我有一个作用域枚举: enum class E { A, B, C }; 现在我想要一个函数,它接受该作用域 int 的值或 int 本身。 应该是这样的: template ::value, int
我有以下 Python 脚本: x = 300000000.0 while (x < x + x): x = x + x print "exec: " + str(x) print "
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: how does do{} while(0) work in macro? 示例来自 this博文: #de
我的问题是:“语言设计者为什么要考虑允许在不同数据类型之间进行比较?”。另外,这在功能语言中是否更有意义? 例如,在erlang中,可以执行以下比较: %% Tuples are greater th
我在玩 GHCI,遇到了这个(对我来说)奇怪的小东西。 我试过这个: λ> let fibs = 1 : 1 : zipWith (+) fibs (tail fibs) λ> fibs 只是为了看看
我们正在 Fixtures 的帮助下为我们的 Grails 2.0.0 应用程序编写集成测试。和 Buid-Test-Data插件。 在测试过程中,发现集成测试有时会失败,有时会通过。运行“test-
我目前有一个脚本应该获取并返回 Bit.ly 链接的点击次数。我首先从 Bitly url 收集和读取数据,我似乎在做正确的事情。 bitly_data = "https://api-ssl.
我正在为我的老师测试一些东西,他想看看如果我们模拟同步,下面的程序如何运行得更快(我知道它不可能完全同步,这只是为了实验学习/练习)多只 turtle 的运动。我尝试过使用诸如多处理、线程之类的模块,
所以我在一个输出大图像(从 30MB 到 2GB+ 的任何地方)的设备上工作。在我们开始创建这些图像之一之前,我们通过 GetDiskFreeSpaceEx 检查是否有足够的磁盘空间。通常(在这种情况
我正在尝试通过深入了解操作系统的底层细节来学习操作系统。我现在上的类(class)是MIT 6.828 Operating System Engineering 。该实验室要求学生追踪 BIOS 以获
我知道你不能在 Lua 中重复匹配组。例如,如果我想匹配两个连续的 "45",我不能这样做: print(string.find("some 4545 text", "(%d%d)+")) 这将打印
这是我创建的一个 plunker:http://plnkr.co/edit/ZoKsO7wu5OvCYtwEi9Iy?p=preview . 点击列表中使用 ng-repeat 渲染的项目之一,例如
我是一名优秀的程序员,十分优秀!