- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我刚刚偶然发现了一项似乎具有违反直觉的性能影响的更改。任何人都可以为这种行为提供可能的解释吗?
原代码:
for (int i = 0; i < ct; ++i) {
// do some stuff...
int iFreq = getFreq(i);
double dFreq = iFreq;
if (iFreq != 0) {
// do some stuff with iFreq...
// do some calculations with dFreq...
}
}
在“性能测试”期间清理这段代码时,我决定将 dFreq
的定义移到 if
block 中,因为它只在 如果
。有几个计算涉及 dFreq
,所以我没有完全消除它,因为它确实节省了从 int
到 double
的多次运行时转换的成本>。我预计没有性能差异,或者如果有的话,可以忽略不计的改进。但是,性能下降了近 10%。我对此进行了多次测量,这确实是我所做的唯一更改。上面显示的代码片段在其他几个循环中执行。我在运行中获得了非常一致的计时,并且可以肯定地确认我所描述的更改将性能降低了约 10%。我预计性能会提高,因为 int
到 double
的转换只会在 iFreq != 0
时发生。
更改代码:
for (int i = 0; i < ct; ++i) {
// do some stuff...
int iFreq = getFreq(i);
if (iFreq != 0) {
// do some stuff with iFreq...
double dFreq = iFreq;
// do some stuff with dFreq...
}
}
谁能解释一下?我正在使用带有/O2 的 VC++ 9.0。我只是想了解我在这里没有说明的内容。
最佳答案
在使用 iFreq 进行计算之前,您应该立即将转换为 dFreq 放在 if() 中。如果指令在代码中更靠上,则转换可以与整数计算并行执行。一个好的编译器可能能够将它推得更远,而一个不太好的编译器可能只是让它落在原地。由于您将它移动到整数计算之后,它可能无法与整数代码并行运行,从而导致速度减慢。如果它确实并行运行,则可能几乎没有任何改进,具体取决于 CPU(发出从未使用过结果的 FP 指令对原始版本几乎没有影响)。
如果真的想提升性能,已经有不少人做过benchmarks,按顺序排列如下编译器:
1) ICC - 英特尔编译器2) GCC - 不错的第二名3) MSVC - 生成的代码与其他代码相比可能非常差。
如果他们有,您可能还想尝试 -O3。
关于c++ - 奇怪的 C++ 性能差异?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2209603/
我有这种来自 Google map 自动完成的奇怪行为(或者我可能错过了某事)...想法?奇怪的: 您在输入中输入某物,例如“伦敦” 您按 [ENTER] 你按下 [CLEAR] 按钮 你点击进入'输
这段代码与《Learning Java》(Oracle Press Books)一书中的代码完全一样,但它不起作用。我不明白为什么它不起作用,它应该起作用。我用 OpenJDK 和 Sun JDK 7
示例 1 中究竟发生了什么?这是如何解析的? # doesnt split on , [String]::Join(",",("aaaaa,aaaaa,aaaaa,aaaaa,aaaaa,aa
我需要获得方程式系统的解决方案。为此,我使用函数sgesv_()。 一切都很好,它使我感到解决方案的正确结果。 但是我得到一个奇怪的警告。 警告:从不兼容的指针类型传递'sgesv_'的参数3 我正在
我目前在制作动画时遇到一个奇怪的问题: [UIView animateWithDuration:3 delay:0
alert('works'); $(window).load(function () { alert('does not work'); });
我的代码: public class MyTest { public class StringSorter implements Comparator { public
我正在学习 JavaScript。尝试理解代码, function foo (){ var a = b = {name: 'Hai'}; document.write(a.name +''
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
这按预期工作: [dgorur@ted ~]$ env -i env [dgorur@ted ~]$ 这样做: [dgorur@ted ~]$ env -i which date which: no
struct BLA { int size_; int size()const{ return size_; } } int x; BLA b[ 2 ]; BLA * p = &b[
我有以下代码: #test img {vertical-align: middle;} div#test { border: 1px solid green; height: 150px; li
我想大多数使用过 C/C++ 的人都对预处理器的工作原理有一定的直觉(或多或少)。直到今天我也是这么认为的,但事实证明我的直觉是错误的。故事是这样的: 今天我尝试了一些东西,但我无法解释结果。首先考虑
我想为 TnSettings 做 mock,是的,如果通过以下方法编写代码,它就可以工作,问题是我们需要为每个案例编写 mock 代码,如果我们只 mock 一次然后执行多个案例,那么第二个将报告异常
我的项目中有以下两个结构 typedef volatile struct { unsigned char rx_buf[MAX_UART_BUF]; //Input buffer over U
Regex rx = new Regex(@"[+-]"); string[] substrings = rx.Split(expression); expression = "-9a3dcb
我的两个应用程序遇到了一个奇怪的问题。这是设置: 两个 tomcat/java 应用程序,在同一个网络中运行,连接到相同的 MS-SQL-Server。一个应用程序,恰好按顺序位于 DMZ 中可从互联
我目前正在与 Android Api Lvl 8 上的 OnLongClickListener 作斗争。 拿这段代码: this.webView.setOnLongClickListener(new
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况相关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
只是遇到了奇怪的事情。我有以下代码: -(void)ImageDownloadCompleat { [self performSelectorOnMainThread:@selector(up
我是一名优秀的程序员,十分优秀!