- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
全局指针和 VS2010 优化器的全局引用之间的最大区别是什么?为什么引用没有解析下来?
typedef unsigned char byte_t;
typedef unsigned short word_t;
struct byte_reg_t
{
byte_t low;
byte_t high;
};
union word_reg_t
{
word_t value;
byte_reg_t part;
};
word_reg_t r16;
byte_t& low_ref = r16.part.low;
byte_t* const low_ptr = &r16.part.low;
#define SPLIT() _asm nop;
int main()
{
low_ref = 4;
SPLIT()
byte_t a = r16.part.low;
SPLIT()
byte_t b = low_ref;
SPLIT()
byte_t c = *low_ptr;
SPLIT()
return a+b+c;
}
在 Release模式下使用汇编输出编译产生这个结果
;byte_t a = r16.part.low;
mov cl, BYTE PTR ?r16@@3Tword_reg_t@@A
;byte_t b = low_ref;
mov edx, DWORD PTR ?low_ref@@3AAEA ; low_ref
mov dl, BYTE PTR [edx]
;byte_t c = *low_ptr;
mov al, BYTE PTR ?r16@@3Tword_reg_t@@A
未经修改的反汇编
.text:00401000 _main proc near ; CODE XREF: __tmainCRTStartup+11D
.text:00401000 mov eax, ?low_ref@@3AAEA ; uchar & low_ref
.text:00401005 mov byte ptr [eax], 4
.text:00401008 nop
.text:00401009 mov cl, ?r16@@3Tword_reg_t@@A ; word_reg_t r16
.text:0040100F nop
.text:00401010 mov edx, ?low_ref@@3AAEA ; uchar & low_ref
.text:00401016 mov dl, [edx]
.text:00401018 nop
.text:00401019 mov al, ?r16@@3Tword_reg_t@@A ; word_reg_t r16
.text:0040101E nop
.text:0040101F movzx eax, al
.text:00401022 movzx edx, dl
.text:00401025 movzx ecx, cl
.text:00401028 add eax, edx
.text:0040102A add eax, ecx
.text:0040102C retn
.text:0040102C _main endp
.data:00403374 ?r16@@3Tword_reg_t@@A db ? ; DATA XREF: _main+9
.data:00403374 ; _main+19
.data:00403375 align 4
.data:00403018 ; unsigned char & low_ref
.data:00403018 ?low_ref@@3AAEA dd offset ?r16@@3Tword_reg_t@@A ; DATA XREF: _main
.data:00403018 ; _main+10
.data:00403018 ; word_reg_t r16
我测试了几种变体(从函数返回等)——如果 low_ref 正在使用则无法解决
更新
这似乎是一个不常见的优化案例 - 感谢 Michael Burr
如果引用在函数作用域中,或者在函数作用域中实例化的类或结构内部,则它有效(但仍然奇怪的是,优化器解析 ptr const 而不是引用——它们 100% 相同)
更新 2
它更奇怪 - 如果你从 byte_t 切换到 int 两种解析都有效 - const ptr 和 reference
所以 ptr const 和引用的优化器、引用范围......和引用的类型......有时 :) 存在细微差别
更新 3
更简单的测试代码 - 使用 VS2010 和 clang 3.1 检查
typedef unsigned char byte_t;
typedef unsigned int dword_t;
//for msvc
#define SPLIT() _asm nop _asm nop;
//for clang
//#define SPLIT() asm("nop"); asm("nop");
byte_t byte;
dword_t dword;
byte_t& global_ref_byte = byte;
dword_t& global_ref_dword = dword;
byte_t* const global_ptrc_byte = &byte;
dword_t* const global_ptrc_dword = &dword;
int main(int argc, char** argv)
{
byte_t& local_ref_byte = byte;
dword_t& local_ref_dword = dword;
dword_t random = (dword_t)argv;
byte = (byte_t)random;
dword = (dword_t)random;
SPLIT()
byte_t a = global_ref_byte;
SPLIT()
dword_t b = global_ref_dword;
SPLIT()
byte_t c = *global_ptrc_byte;
SPLIT()
dword_t d = *global_ptrc_dword;
SPLIT()
byte_t e = local_ref_byte;
SPLIT()
dword_t f = local_ref_dword;
SPLIT()
dword_t result = a+b+c+d+e+f;
return result;
}
VS2010拆解
.text:00401000 ; int __cdecl main(int argc, const char **argv, const char **envp)
.text:00401000 _main proc near ; CODE XREF: ___tmainCRTStartup+11D
.text:00401000
.text:00401000 argc = dword ptr 8
.text:00401000 argv = dword ptr 0Ch
.text:00401000 envp = dword ptr 10h
.text:00401000
.text:00401000 push ebp
.text:00401001 mov ebp, esp
.text:00401003 mov eax, [ebp+argv]
.text:00401006 push ebx
.text:00401007 push esi
.text:00401008 push edi
.text:00401009 mov byte_403374, al
.text:0040100E mov dword_403378, eax
.text:00401013 nop
.text:00401014 nop
.text:00401015 mov eax, off_40301C
.text:0040101A mov al, [eax]
.text:0040101C nop
.text:0040101D nop
.text:0040101E mov ecx, dword_403378
.text:00401024 nop
.text:00401025 nop
.text:00401026 mov dl, byte_403374
.text:0040102C nop
.text:0040102D nop
.text:0040102E mov esi, dword_403378
.text:00401034 nop
.text:00401035 nop
.text:00401036 mov bl, byte_403374
.text:0040103C nop
.text:0040103D nop
.text:0040103E mov edi, dword_403378
.text:00401044 nop
.text:00401045 nop
.text:00401046 movzx edx, dl
.text:00401049 movzx ebx, bl
.text:0040104C add edx, edi
.text:0040104E movzx eax, al
.text:00401051 add edx, ebx
.text:00401053 add eax, edx
.text:00401055 pop edi
.text:00401056 add eax, esi
.text:00401058 pop esi
.text:00401059 add eax, ecx
.text:0040105B pop ebx
.text:0040105C pop ebp
.text:0040105D retn
.text:0040105D _main endp
clang 3.1反汇编
.text:004012E0 sub_4012E0 proc near ; CODE XREF: sub_401020+91
.text:004012E0
.text:004012E0 arg_4 = dword ptr 0Ch
.text:004012E0
.text:004012E0 push ebp
.text:004012E1 mov ebp, esp
.text:004012E3 call sub_4014F0
.text:004012E8 mov eax, [ebp+arg_4]
.text:004012EB mov byte_402000, al
.text:004012F0 mov dword_402004, eax
.text:004012F5 nop
.text:004012F6 nop
.text:004012F7 movzx eax, byte_402000
.text:004012FE nop
.text:004012FF nop
.text:00401300 add eax, dword_402004
.text:00401306 nop
.text:00401307 nop
.text:00401308 movzx ecx, byte_402000
.text:0040130F add ecx, eax
.text:00401311 nop
.text:00401312 nop
.text:00401313 add ecx, dword_402004
.text:00401319 nop
.text:0040131A nop
.text:0040131B movzx eax, byte_402000
.text:00401322 add eax, ecx
.text:00401324 nop
.text:00401325 nop
.text:00401326 add eax, dword_402004
.text:0040132C nop
.text:0040132D nop
.text:0040132E pop ebp
.text:0040132F retn
.text:0040132F sub_4012E0 endp
如果没有 nop,两个优化器都可以生成更好的代码——但 clang 仍然更好
VS2010(更多代码因为未解析的字节引用)
.text:00401003 mov eax, [ebp+argv]
.text:00401006 movzx ecx, al
.text:00401009 lea edx, [eax+eax*2]
.text:0040100C mov byte_403374, al
.text:00401011 mov dword_403378, eax
.text:00401016 lea eax, [edx+ecx*2]
.text:00401019 mov ecx, off_40301C
.text:0040101F movzx edx, byte ptr [ecx]
.text:00401022 add eax, edx
clang 3.1:
.text:004012E8 mov eax, [ebp+arg_4]
.text:004012EB mov byte_402000, al
.text:004012F0 mov dword_402004, eax
.text:004012F5 movzx ecx, al
.text:004012F8 add ecx, eax
.text:004012FA lea eax, [ecx+ecx*2]
最佳答案
这就是我认为正在发生的事情。该引用被视为类似于非常量全局指针。如果从 low_ptr
声明中删除 const
,您会看到这一点。
您还可以看到,如果将引用移动到函数的本地,编译器能够毫无问题地优化通过它的访问。
我猜想由于全局引用非常少见(我承认这是我编造的“统计数据”),所以几乎没有努力优化它们。
关于c++ - 全局指针由优化器解析 - 但引用不是 - 为什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11307929/
我的应用程序中有一个 settings.php 页面,它使用 $GLOBALS 来存储网络应用程序中使用的配置。 例如,他是我使用的一个示例设置变量: $GLOBALS["new_login_page
我正在尝试编译我们在 OS 类上获得的简单操作系统代码。它在 Ubuntu 下运行良好,但我想在 OS X 上编译它。我得到的错误是: [compiling] arch/i386/arch/start
我知道distcp无法使用通配符。 但是,我将需要在更改的目录上安排distcp。 (即,仅在星期一等“星期五”目录中复制数据),还从指定目录下的所有项目中复制数据。 是否有某种设计模式可用于编写此类
是否可以在config.groovy中全局定义资源格式(json,xml)的优先级,而不是在每个Resource上指定?例如,不要在@Resource Annotation的参数中指定它,例如: @R
是否有一些简单的方法来获取大对象图的所有关联,而不必“左连接获取”所有关联?我不能只告诉 Hibernate 默认获取 eager 关联吗? 最佳答案 即使有可能有一个全局 lazy=false(谷歌
我正在尝试实现一个全局加载对话框...我想调用一些静态函数来显示对话框和一些静态函数来关闭它。与此同时,我正在主线程或子线程中做一些工作...... 我尝试了以下操作,但对话框没有更新...最后一次,
当我偶然发现 this question 时,我正在阅读更改占位符文本。 无论如何,我回去学习了占位符。一个 SO 的回答大致如下: Be careful when designing your pl
例如,如果我有这样的文字: "hello800 more text 1234 and 567" 它应该匹配 1234 和 567,而不是 800(因为它遵循 hello 的 o,这不是一个数字)。 这
我一直在尝试寻找一种无需使用 SMS 验证系统即可验证电话号码(Android 和 iPhone)的方法。原因纯粹是围绕成本。我想要一个免费的解决方案。 我可以安全地假设 Android 操作系统会向
解决此类问题的规范 C++ 设计模式是什么? 我有一些共享多个类的多线程服务器。我需要为大多数类提供各种运行时参数(例如服务器名称、日志记录级别)。 在下面的伪 C++ 代码中,我使用了一个日志记录类
这个问题在这里已经有了答案: Using global variables in a function (25 个答案) 关闭 9 年前。 我是 python 的新手,所以可能有一个简单的答案,但我
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Does C++ call destructors for global and class static
我正在尝试使用 Objective-C 中的 ArrayList 的等价物。我知道我必须使用 NSMutableArray。我想要一个字符串列表 (NSString)。关键是我的列表应该可以从我类(c
今天刚开始学习 Android 开发,我找不到任何关于如何定义 Helper 类或将全局加载的函数集合的信息,我会能够在我创建的任何 Activity 中使用它们。 我的计划是创建(至少目前)2 个几
为什么这段代码有效: var = 0 def func(num): print num var = 1 if num != 0: func(num-1) fun
$GLOBALS["items"] = array('one', 'two', 'three', 'four', 'five' ,'six', 'seven'); $alter = &$GLOBALS
我想知道如何实现一个可以在任何地方使用您自己的设置的全局记录器: 我目前有一个自定义记录器类: class customLogger(logging.Logger): ... 该类位于一个单独的
我需要使用 React 测试库和 Jest 在我的测试中模拟不同的窗口大小。 目前我必须在每个测试文件中包含这个beforeAll: import matchMediaPolyfill from 'm
每次我遇到单例模式或任何静态类(即(几乎)只有静态成员的类)的实现时,我想知道这是否实际上不是一种黑客行为,因此只是为了设计而严重滥用类和实例的原则单个对象,而不是设计类和创建单个实例。对我来说,看起
这个问题在这里已经有了答案: Help understanding global flag in perl (2 个回答) 7年前关闭。 my $test = "There was once an\n
我是一名优秀的程序员,十分优秀!