- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在做一些手工优化我的一些代码,但不知何故被 gcc 咬伤了。
原始代码在通过测试时大约需要 3.5 秒才能完成执行。
我很困惑为什么我的优化版本现在需要大约 4.3 秒才能完成测试?
我将 __attribute__((always_inline))
应用于探查器中突出显示的局部静态函数之一,现在它自豪地在 2.9 秒内运行。不错。
我一直相信 gcc 可以在函数内联中做出决定,但显然它似乎并不那么完美。我不明白为什么 gcc 最终会做出一个非常错误的决定,是否要使用 -O3 -flto -fwhole-program
内联文件范围的静态函数。编译器真的只是在猜测内联函数的成本效益吗?
最佳答案
编辑:要回答实际问题,是的,编译器确实“猜测” - 或者作为技术术语,它使用“启发式” - 确定内联特定函数将导致的速度与空间的增益in. Heuristics被定义为“一种实用但理论上不完美的解决方案”。结束编辑。
在没有看到代码的情况下,很难说出编译器中发生了什么。您正在做正确的事情来分析您的代码,尝试您的手动优化并再次分析 - 如果更好,请保留它!
编译器时常出错的情况并不少见。人类有时更聪明——但我通常相信编译器会把它做好。可能是该函数被调用了很多次并且相当大,因此编译器决定“它超出了代码膨胀与速度增益的阈值”?或者它可能只是没有得到“内联有多好/多坏”的正确计算。
请记住,编译器是通用的,适用于一种情况的方法可能会使另一种情况变得更糟 - 因此编译器必须妥协并提出一些合理的启发式方法,这些启发式方法不会经常给出太糟糕的结果。
如果您可以运行配置文件引导的优化,它可能会帮助编译器做出正确的决定(因为它会知道有多少次迭代以及采用特定分支的频率)...
如果您可以与 GCC 编译器团队共享代码,将其报告为错误 - 他们可能会忽略/拒绝它“太特殊”或类似的东西,但这种特殊情况很可能是“被遗漏的”出来”。
我认为可以公平地说编译器“经常正确”,但这并不意味着它总是正确。我最近看了一些从 Clang 生成的代码,它有一大堆额外的指令来展开循环——但在最典型的情况下,循环将是一次迭代,而且永远不会超过 16 次。所以展开循环的额外指令对于 1 的情况,4 倍的循环完全浪费了,即使对于可能的最长循环也是相当无用的。自然循环“滚动”大约只有 3-4 条指令,因此即使循环大得多,节省的空间也很小——当然,如果是一百万次迭代,它的速度可能会提高三倍功能。
关于c++ - 最好不要相信 gcc 默认内联程序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32153187/
我收到此错误消息: .rvm/gems/ruby-2.5.1/bin/ruby_executable_hooks:24:in `' 我重新安装了 Ruby rvm reinstall ruby-2.5
我开始从事 WPF Ribbon 开发,非常好! 我的问题是找到(免费)基本图标(如文件保存/打开/等,剪切/粘贴/等)。 你有什么建议吗? 最佳答案 你看过Visual Studio Icon Li
我只找到经典的声音ID,但我需要Chord(默认)日历警报。如何播放声音? ks #define systemSoundID 1315 AudioServicesPlaySystemSound (s
在 Magento 中创建货件时,有一个复选框可让您“通过电子邮件发送货件副本”。 默认情况下未选中。有谁知道我需要编辑哪个文件才能默认设置为“选中”? 最佳答案 这是一个app/design/adm
我有一个简单的 IValueConverter,它只使用 TypeConverter 进行转换。但是,在某些情况下,提供的 TypeConverter 会失败。 如果转换器未提供 Binding,我想
我正在阅读教程,默认 Activity 是一个扩展另一个类的类,它所拥有的只是一个覆盖方法。应用程序如何工作,因为它不做任何其他事情?我很困惑! 最佳答案 父类 Activity 为您处理一切。 关于
我刚刚开始研究游戏框架。我正在尝试构建 rest api,并将 postgresql 用于我的数据库连接。这是我第一次同时使用 play 和 postgre。我在 build.sbt 中建立了一个数据
是否可以创建具有以下属性的 python 对象: class Foo: def __default_method__(x): return x f = Foo() f(10) > 10
我是 jQuery 的新手,遇到了一个烦人的问题。我有一些登录字段,当该字段为空时会填充默认文本,然后在单击时删除。 我的问题是,当用户保存了他们的用户名/密码(使用浏览器)时,如果他们返回页面,登录
考虑这个代码片段: void Foo(std::string str1, std::string str2) {} template void Bar() { Foo(Types{}...);
我正在编写一个简单的 C 程序,我应该用缓冲区溢出来攻击它。所以,我不想在编译时使用任何标志。如何消除使用的默认标志? # readelf -p .GCC.command.line stack Str
考虑这个代码片段: void Foo(std::string str1, std::string str2) {} template void Bar() { Foo(Types{}...);
我有以下代码[这是一道面试题]: #include #include using namespace std; class A{ public: A(){ cout co
我想在 Autofac 中为每个匹配的生命周期范围注册创建一个实例,但偶尔需要从全局容器(没有匹配的生命周期范围)请求一个实例。在不存在匹配生命周期范围的情况下,我想给出一个顶级实例而不是抛出异常。
我正在做一个收集单词共现的修改版本,所以我编写了自己的 javascript,我正在跟踪三个对象中的出现。但是,一旦对象变大(约 800 万、300 万和 172000),每 100000 个句子需要
我正在使用 pykalman 模块中的 KalmanFilter,我想知道它如何处理缺失的观察结果。根据文档: In real world systems, it is common to have
我有一个应用了 RenderTransform 的 Canvas ,如下所示: 谁能告诉我这些值是什么意思?我似乎无法找到用于解析这些值的转换器。 最佳答案 如 RenderTransform是 T
我是 Linux 的新手,现在使用 CentOS 6。我在这里使用 MySQL 工作台,每当我尝试添加新连接时,它都会询问我默认的 key 环密码。我真的不知道,这个密码是从哪里设置的,我之前没有设置
我在 Ubuntu 18.04 上工作。我没有定义 GL_GLEXT_PROTOTYPES .我使用 glXGetProcAddress 加载“核心”OpenGL 函数.我的申请链接到 /usr/li
我按照文档中的示例添加了对使用 asio 加载 HTTPS 站点的支持,这意味着我调用 ctx.set_default_verify_paths();使用系统默认路径来查找证书。 然而,我得到:una
我是一名优秀的程序员,十分优秀!