- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我的同事喜欢使用带“-g -O0”的 gcc 来构建生产二进制文件,因为如果发生核心转储,调试很容易。他说不需要使用编译器优化或调整代码,因为他发现生产过程中的 CPU 负载不高,例如30%左右。
我问他原因,他告诉我:如果CPU负载不高,瓶颈一定不是我们的代码性能,应该是一些IO(磁盘/网络)。因此,使用 gcc -O2 无法改善延迟和吞吐量。这也表明我们在代码中没有太多需要改进的地方,因为 CPU 不是瓶颈。对吗?
最佳答案
我希望程序中的大多数优化问题都与高于平常的 CPU 负载相关,因为我们说次优程序做的比理论上需要的多。但这里的“平常”是一个复杂的词。我不认为您可以选择优化变得有用的系统范围 CPU 负载百分比的硬性值。
如果我的程序在循环中重新分配一个 char
缓冲区,当它不需要时,我的程序运行速度可能比它需要的慢十倍,我的 CPU 使用率可能高十倍比需要的多,优化功能可能会使应用程序性能提高十倍……但 CPU 使用率可能仍然只占整个系统容量的 0.5%。
即使我们要选择开始分析和优化的 CPU 负载阈值,在通用服务器上我也会说 30% 太高了。但这取决于系统,因为如果你正在为一个只运行你的程序的嵌入式设备编程,并且因为它有足够的能力来运行你的程序而被选择和购买,那么 30% 可能相对较低事情的计划。
此外,并非所有优化问题确实与高于平常的 CPU 负载有任何关系。也许您只是在 sleep
中等待的时间比您实际需要的时间长,导致消息延迟增加但显着减少 CPU 使用率。
tl;dr:您同事的观点过于简单化,可能在任何方面都与现实不符。
但是,关于您问题的真正症结所在,在关闭所有编译器优化的情况下部署发布版本是相当不寻常的。编译器被设计为在 -O0
处发出非常简单的代码,并在 2016 年在 -O1
和 - 处进行几乎“标准”的那种优化。 O2
。通常希望您将这些打开以供生产使用,否则您将浪费现代编译器功能的很大一部分。
许多人也倾向于不在发布版本中使用 -g
,这样部署的二进制文件更小,更容易让您的客户处理。通过执行此操作,您可以将 45MB 的可执行文件减少到 1MB,无需零钱。
这是否会使调试变得更加困难?是的,它可以。通常,如果找到错误,您希望收到重现步骤,然后您可以在应用程序的调试友好版本中重复这些步骤,并分析由此产生的堆栈跟踪。
但是如果bug不能按需重现,或者只能在release build中重现,那你可能就有问题了。因此,在 (-O1
) 上保持基本优化但同时在 (-g
) 中保持调试符号似乎是合理的;优化本身不应极大地妨碍您分析客户提供的核心转储的能力,调试符号将使您能够将信息与源代码相关联。
话虽这么说,您也可以吃蛋糕:
-O2 -g
构建您的应用程序>strip
,以删除调试符号;否则二进制文件将是相同的您还应该在您的应用程序中有足够的日志记录,以便能够在不需要任何这些的情况下跟踪大多数错误。
关于c++ - gcc/C++ : If CPU load is low, 那么代码优化没什么用,对吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34676950/
我正在研究树问题 Convert Sorted Array to Binary Search Tree - LeetCode Given an array where elements are sor
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
目前我想使用来自 http://codepen.io/JaxoDI/pen/DtsdH 的评级系统.但目前它在您从右向左悬停时有效。请随意在给定的链接中尝试一下。但我想要一个从左到右悬停的评级系统。
我读过多篇文章,包括 Jon Bentley 的二分查找章节。这是我对 CORRECT 二进制搜索逻辑的理解,它在我所做的简单测试中有效: binarysearch (arr, low, high,
我设置了 doobie + hikaricp,其设置与默认设置类似。通过调试日志记录,我可以看到有多少连接处于事件/空闲状态,这也反射(reflect)了 pg_stat_activity 通过此查询
我了解 >>> 修复了溢出:当添加两个大的正长时,您最终可能会得到一个负数。有人能解释一下这种按位移位如何神奇地解决溢出问题吗?它与 >> 有何不同? 我的怀疑:我认为这与 Java 使用二进制补码这
返回值存储在内存中的哪个位置? 考虑以下代码: int add(int a, int b) { int result = a+b; return result; } void main
我打算开发一个内置 TI CC2540 的小型设备。它将与 iPhone4s 通信。该设备旨在接收来自 iPhone 的命令并对其执行特定操作。大多数时间设备处于空闲状态(99% 的时间)。但在任何时
嗯,这是一个低级问题 假设我存储一个数字(当然是二进制格式的计算机存储数字) 如何以十进制格式打印它。在高级程序中很明显,只需打印它,库就会为您完成。 但是在我没有这个库的非常低级的情况下怎么样。 我
您一直听说高频交易 (HFT) 以及算法有多快。但我想知道 - 现在什么是快? 更新 我考虑的不是交易所和运行交易应用程序的服务器之间的物理距离造成的延迟,而是程序本身引入的延迟。 更具体地说:从事件
嗨,我是韩国人,对“ Bootstrap 首先将自身复制到固定的高端内存地址以为操作系统释放低端内存”感到困惑。 我通过谷歌搜索发现的关于低内存的知识是,这是 DOS 系统中的第一个 640K 内存。
在 Trac 主要功能页面中 https://trac.edgewall.org/wiki/TracFeatures Trac 据说强调“易用性和低调”。有人可以解释一下“仪式”在软件使用方面的含义吗
我想知道在游戏过程中如何处理低电量警报。我使用 Cocos2D 来制作我的游戏。当出现短信或电话等中断时,我会让游戏暂停。但是低电量警报又如何呢?它们与其他中断相同吗?看来并非如此。 有什么方法可以检
我和一个 friend 正在与脑筋急转弯来回走,我不知道如何解决这个问题。我的假设是某些按位运算符是可能的,但不确定。 最佳答案 在C中,按位运算符: #include int add(int x,
如果你看过我的另一篇 question ,你会知道我已经花了这个周末组装一个 6502 CPU 仿真器作为一个编程练习。 CPU 模拟器大部分是完整的,从我有限的测试来看似乎相当准确,但是它运行得非常
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 3 年前。 Improve th
我想知道使用 Java 做一些低级或操作系统的东西(一个项目)是否有意义。我之所以问这个问题,是因为我想扩展我在 Java 方面的知识,并且我喜欢做文件压缩器、批量文件重命名器等工作。有没有我可以查看
Cheat Engine带有一个称为速度破解的功能,它基本上可以减慢或提高游戏速度。其实不光是游戏,如果有一款带时钟的软件也可以加快速度。这是如何运作的?我可能会想象有一些内部时钟在运行这些东西,但不
我知道 >> 表示有符号,>>> 表示无符号 类似的问题不能回答我的问题: Java, will (low + high) >>> 1 overflow? Safe integer middle va
我是一名法国学生,实际上我在移动应用程序中实习。 我使用以下代码创建了一个应用程序来获取有关加速度计传感器的信息: @Override protected void onCreate(Bundle s
我是一名优秀的程序员,十分优秀!