- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我在玩编译器资源管理器时发现这两个函数在 gcc 和 clang 中生成不同的程序集。我预计在内联后它们会产生相同的表达式树,从而产生相同的最佳装配。
constexpr bool is_nonzero_decimal_digit(char const c) noexcept
{
return c == '1' || c == '2' || c == '3' || c == '4' || c == '5'
|| c == '6' || c == '7' || c == '8' || c == '9';
}
bool is_decimal_digit_v1(char const c) noexcept
{
return c == '0' || is_nonzero_decimal_digit(c);
}
bool is_decimal_digit_v2(char const c) noexcept
{
return c == '0' || c == '1' || c == '2' || c == '3' || c == '4'
|| c == '5' || c == '6' || c == '7' || c == '8' || c == '9';
}
Clang 3.9.1 -std=c++1z -O3 结果
is_decimal_digit_v1(char):
cmp dil, 48
sete cl
add dil, -49
cmp dil, 9
setb al
or al, cl
ret
is_decimal_digit_v2(char):
add dil, -48
cmp dil, 10
setb al
ret
gcc 6.3 -std=c++1z -O3 结果
is_decimal_digit_v1(char):
cmp dil, 48
je .L3
sub edi, 49
cmp dil, 8
setbe al
ret
.L3:
mov eax, 1
ret
is_decimal_digit_v2(char):
sub edi, 48
cmp dil, 9
setbe al
ret
那么,这是优化器的怪癖还是语言规则禁止优化的结果?
最佳答案
这是 gcc < 7.0 和 clang 优化器的一个怪癖。正如 Cornstalks 在评论中指出的那样,gcc 7.0 能够生成最佳汇编。我还检查了 VC++ 2015,它也是这样做的:
is_decimal_digit_v2:
sub cl, 48
cmp cl, 9
setbe al
ret 0
is_decimal_digit_v1:
sub cl, 48
cmp cl, 9
setbe al
ret 0
作为 T.C.指出,内联是在一些优化通过之后执行的,在这个特定的代码中,它将一系列比较合并到一个更简单的范围检查中。在内联之前这样做很有用,可以使叶函数更小,这反过来又增加了它们被内联的机会。基本上,v1 函数被转换成这样:
bool is_decimal_digit_v3(char const c) noexcept
{
if (c == 48) return true;
// this is what was inlined
char tmp = c - 49;
return tmp >= 0 && tmp < 9;
}
而 v2 被转换为更简单的形式:
bool is_decimal_digit_v4(char const c) noexcept
{
char tmp = c - 48;
return tmp >= 0 && tmp < 10;
}
为 v3 生成的程序集与为 v1 生成的程序集类似
#clang 3.9.1
is_decimal_digit_v3(char): # @is_decimal_digit_v3(char)
cmp dil, 48
sete cl
add dil, -49
cmp dil, 9
setb al
or al, cl
ret
# gcc 6.3
is_decimal_digit_v3(char):
cmp dil, 48
je .L8
sub edi, 49
cmp dil, 8
setbe al
ret
.L8:
mov eax, 1
ret
我想,要将 v3 转换为 v4,需要一些 gcc 7.0 能够完成的重要分析。此版本为所有四个片段生成完全相同的程序集:
is_decimal_digit_v1(char):
sub edi, 48
cmp dil, 9
setbe al
ret
is_decimal_digit_v2(char):
sub edi, 48
cmp dil, 9
setbe al
ret
is_decimal_digit_v3(char):
sub edi, 48
cmp dil, 9
setbe al
ret
is_decimal_digit_v4(char):
sub edi, 48
cmp dil, 9
setbe al
ret
有趣的是,VC++2015 无法将 v3 转换为 v4 并生成此程序集:
is_decimal_digit_v3:
cmp cl, 48
jne SHORT $LN2@is_decimal
mov al, 1
ret 0
$LN2@is_decimal:
xor eax, eax
sub cl, 49
cmp cl, 8
setbe al
ret 0
如果非要我猜的话,我会说它为 v1 而不是为 v3 生成最佳代码的原因是因为它在减少与范围检查的比较之前进行了内联。
关于c++ - 这是优化器的怪癖还是语言规则禁止优化的结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41576821/
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我有一个小的 win32 程序,它使用给定的 lpCmdLine 调用 CommandLineToArgvW int APIENTRY _tWinMain(HINSTANCE hInstance,
我有一个小的 win32 程序,它使用给定的 lpCmdLine 调用 CommandLineToArgvW int APIENTRY _tWinMain(HINSTANCE hInstance,
这是我为演示古怪行为而创建的示例。我希望 bash 按原样传递引用的命令行参数。 john@doe:~/tmp$ cat script.sh #! /bin/bash set -o xtrace $1
假设我定义了一个什么都不做的简单函数:function fn() { } 现在,当我运行 toString(fn) 时,我得到“[object Object]”。当我运行 toString.call(
我们面临以下检查在 IE 中间歇性失败的问题: 伪代码: setCookie("name","value", "1d"); if(getCookie("name") === "value"){ r
我安装了 Apache 2.4 以发布一个使用 Tomcat 8 作为 AS 的 java (Struts2) 应用程序。 有一段时间效果很好,然后发生了一些“奇怪”的事情(委婉地说)。 通过输入“h
我有以下 if 语句: RG 为“100”,最大值为“85” if (RG == "" | RG > max) { //Doesn't execute } 既然
我一直在为一个客户开发一个网站,我即将结束它。但不幸的是,IE6 让人很头疼。 我的主要问题在这个页面上: http://seaport.bythepixel.com/#storage 列表项没有元素
在 IE7 模式下,我在 IE9 中收到以下错误。使用一个小的计数脚本: SCRIPT1028: Expected identifier, string or number 代码 $.fn.count
感谢这里的帮助,我得到了一个基于 poll() 的大部分可用的 socks4 代理。我正在使用这个程序来学习 C 和套接字编程。该程序仍然缺少对部分写入的 send() 检查,但我相当确定这不是当前问
我认识的某个人刚刚学习编程,偶然发现了这个,让我感到困惑: 请打开控制台 (Chrome/Firefox) 并输入:var name = ['what', 'the', '...?']; 我希望 na
在 SignOut() 调用重定向到“...login.aspx?ReturnUrl=%2fmydomainname%2flogout.aspx”之后使用此方法,这样用户就无法再次登录,因为成功登录会
我写了一个函数,一旦用户满足表单的下一个字段的要求,它就会自动将用户推进到该字段的要求。 我的问题是,在 iPad 中使用它时,它不会聚焦下一个字段,而是隐藏键盘。 我已经放弃尝试修复此问题,并正在寻
考虑以下 Javascript: var anchors = document.getElementsByTagName('a'); for(var i=0; i < anchors.length;
我试图了解 R 的非标准评估。这是一个示例怪癖: > f g h g(1:10) [1] "x" > h(1:10) [1] "1:10" 怎么来的? g 和 h 结果之间差异的确切来源是什么? 编辑
我是一个涉足 C 的新手,我的小项目是编写一个简单的 SOCKS4 代理。感谢这里的帮助,到目前为止我已经在我的例程中使用非阻塞套接字和 poll() 了。然而此时我似乎有两个问题: 如果传入 Soc
我有这个代码:https://plnkr.co/edit/t1GKaQOGnFxkTMK03Ynk var MIN = 60; var HR = MIN * 60; var tripDom
我将如何使用功能检测来确定是否需要在禁用的输入元素上模拟标题属性。 我知道 Firefox 声明并解释了该规范,以便它按预期工作,但我仍然希望显示工具提示。 我唯一能想到的就是直接使用浏览器检测。 可
我遇到了一些关于框架和 Internet Explorer 的非常奇怪的行为。 情况是这样的: 我在 www.webapp.com 上有我的网络应用程序 我有一个客户想要在他的网站上有一个登录框到我的
我是一名优秀的程序员,十分优秀!