- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
__declspec(dllexport)
float foo(float x) {
return (x < 0) ? x * -1 : x;
}
这是计算 abs(x)
的非常简单的实现,其中 x
是一个 float
。我在 Release模式下编译了它并启用了我能找到的所有优化。生成的 asm
是:
; 4 : return (x < 0) ? x * -1 : x;
movss xmm1, DWORD PTR _x$[ebp]
xorps xmm0, xmm0
comiss xmm0, xmm1
jbe SHORT $LN3@foo
xorps xmm1, DWORD PTR __xmm@80000000800000008000000080000000
$LN3@foo:
movss DWORD PTR tv66[ebp], xmm1
fld DWORD PTR tv66[ebp]
如您所见,这仍然包含分支和条件跳转。然而 float
是由 IEEE754 定义的,因此我可以更改实现以简单地将符号位设置为 0:
__declspec(dllexport)
float foo(float x) {
void* bar = &x;
__int32 y = ((*(__int32*)bar) & ~(1 << 31));
return *(float*)&y;
}
它不会跳转并且需要更少的命令:
; 3 : void* bar = &x;
; 4 : __int32 y = ((*(__int32*)bar) & ~(1 << 31));
mov eax, DWORD PTR _x$[ebp]
and eax, 2147483647 ; 7fffffffH
mov DWORD PTR _y$[ebp], eax
; 5 : return *(float*)&y;
fld DWORD PTR _y$[ebp]
我原以为该操作甚至存在特定命令,但也许这仅适用于非常特殊的架构?
那么编译器无法捕获此优化的原因是什么?还是我这样做有误?
最佳答案
因为这会产生负零的错误结果!
负零不小于零,所以它的符号保持为负,使得条件分支的消除无效。
考虑使用类似的东西
copysign(x, 0.0);
相反。
关于c++ - 为什么 VS 2015 编译器不能优化 float 的 abs() 实现中的分支?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39216210/
如果你有一个字符串,假设:AB--AB .我想寻找带有 xpath 的节点,它可以是 AB??AB , 这意味着节点属性中的问号是某种占位符 - 它们的出现次数可能会有所不同,因此它也应该匹配到 AB
我的python版本是2.7.6 我知道 +? 是 + 的非贪婪版本。 这样 re.findall('(ab)+?', 'abab') 将匹配尽可能少的 ab。 结果 ['ab', 'ab'] 因此有
typedef struct unit { struct unit * next; int year; int month; int day; struct unit revisions[3]; ch
特别是 Sql Server 2005/T-Sql。我有一个主要由两个字符组成的字段,它们都应该是大写的,但是有一些遗留数据早于当前的数据库/系统,我需要弄清楚哪些记录违反了大写套管契约。 我认为这会
在 python 中有什么区别: abs(a) 和 operator.abs(a) 它们非常相似,工作方式也相似。如果它们完全相同,那么为什么要制作两个独立的函数来做同样的事情? 如果其中任何一个有一
小心,我说的是::abs() ,而不是 std::abs() 根据cplusplus.com website , abs stdlib. 的行为应该不同h C 版本,如果包含 这是此页面的摘录(涉及
假设我们有数字 81,我们将它分开:8 和 1。如果我们得到这个数字的总和,它将是 9,对吧?让我们检查一下 9 的任意幂是否为 81。是的,9 的平方为 81。 我想找到所有这些数字,直到达到 10
我在postgresql有点情况 我有两个表 t1 和 t2,并且都有一个列具有相同类型的数据“col_data”,col_data 可能只有以下数据 ('ab', 'cd', 'ab,cd', 'c
这个问题在这里已经有了答案: Can we instantiate an abstract class? (16 个答案) 关闭 9 年前。 我有一个关于抽象类的问题。 首先......我正在使用谷
我的问题听起来可能很愚蠢,但我必须在准备学士考试时回答这个问题。 那么,您如何看待 C++ 中的表达式 'ab' == "ab"?这不是真的还是根本不合法和编译错误?我在谷歌上搜索了一下,了解到“ab
我有一个表格,其中填充了某些值,例如 | CODE | NAME | NB: THIS IS A VERY BASIC EXAMPLE | zygnc | oscar alpha |
This question already has answers here: Reference - What does this regex mean?
我正在检查 TypeScript 规范并在某个时间点查看 3.4 Union Types它使用 AB 如下: 一个 |如果 B 是 A 的子类型,则 B 等同于 A。 一个 | B 等同于 B | A
这个问题在这里已经有了答案: What is the difference between .*? and .* regular expressions? (3 个答案) 关闭 7 年前。 +? 匹
下面是我遇到问题的代码。 avg += abs(num) 行有错误,但我无法解决。错误代码: error: call of overloaded 'abs(double&)' is ambigous
我有一个 Java 方法,它在一个非常紧凑的循环中重复计算以下表达式,并有大量重复: Math.abs(a - b) - Math.abs(c - d) a、b、c 和 d 是 long 值,可以跨越
我有一个 .bin 文件,我想对十六进制数据进行简单的字节反转。例如说 @ 0x10 它读取 AD DE DE C0,希望它读取 DE AD C0 DE。 我知道有一种简单的方法可以做到这一点,但我是
我目前正在用 C++ 编写一些类似于 vector 数学类的 glsl,并且我刚刚实现了一个 abs() 函数,如下所示: template static inline T abs(T _a) {
我正在尝试 ab 测试旋风。 当我跑 ab -n 2000 -c 25 http://127.0.0.1 我得到 ab:无效的 URL。 嗯...当我在我的开发机器上访问 ff 时,该站点就在那里。
我有一个 Swift 文件,我在其中导入了 Foundation 和 CoreGraphics,但是在我调用 abs(x) 的地方,其中 x 是一个 CGFloat,我收到此警告: abs is de
我是一名优秀的程序员,十分优秀!