- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我需要一个针对已排序数字数组的优化二分搜索算法。我这样做了,发现使用 float 存储数字比使用整数更快,因为最后我必须计算
(frameNumber-this->frameNumber[imin])/(this->frameNumber[imax]-this->frameNumber[imin])
this->frameNumber[imin]
是小于 frameNumber
和 this->frameNumber[imax]
的最大 frameNumber是比那个大的最小的那个。该代码用于计算这两个关键帧之间的进度。frameNumber 数组是静态的。我只需要排序一次。但是通过二分查找多次访问,上面的代码计算进度。
从 int 到 float 的转换花费了一些周期。然后我发现在asm中有很多fpu指令。我担心它们可能比整数慢。
那么问题来了。我可以将排序后的 float 数组转换为 int* 并对其运行二进制搜索吗?
这意味着:
void binary_search(float key,float* array,...)
{
int key_integer=*(int*)&key;
int* array_intege(int*)array;
binary_search_for_integers(key_integer,array_integer,...);
}
或者我上面的结论是错误的? (比如将 int 转换为 float 并不那么昂贵,或者浮点之间的比较与整数一样快?
非常感谢!
最佳答案
这似乎是个坏主意。正如@rlbond 指出的那样,对 float 据使用整数比较实际上会产生正确排序的 float 组。 (请参阅 http://www.h-schmidt.net/FloatConverter/IEEE754.html 以使用 float 的二进制表示形式。)在使用它之前检查 sizeof(int32_t) == sizeof(float)
。
这样的 hack 并不是真正需要的。在现代硬件上,float
比较并不比 int
比较昂贵。 (Intel Haswell:ucomiss
是 1 uop,每周期吞吐量 1。与内存操作数相比是 2 uops,虽然没有微融合。而且它不能像 cmp/jcc
) 但是,FP add/sub 和 FP mul 比它们的整数等价物具有更高的延迟,并且吞吐量更低。在写入时将整个数组转换为 float
似乎很愚蠢,只是因为您想在末尾使用最小值和最大值进行一些 FP 数学运算。
加载并转换整数为 float 指令(x86 cvtsi2ss
(有符号整数 2 标量单值))与普通指令一样快,并且占用相同的代码空间加载(movss
)。
如果您的数据最初是整数,而您只使用其中的一部分,请使用 int
(避免转换为以后不再需要的值)。如果您确实访问了所有这些,并且只将您的数据用作 float ,则将其存储为 float
。如果您同时使用它,最好将它存储为 int
,这样当您将它用作整数时它会更快,而当您将它用作 float 时两种方式的速度大致相同。
从您的代码示例中,您只是使用了最小和最大位置的值?查找数组中的最小值和最大值比对整个数组排序要快得多。最小/最大甚至用压缩最小指令向量化。
许多平台的浮点运算速度不如现代 Intel CPU,因此不要过度使用 float 。
关于c++ - 将 float 数组与 int 数组进行比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31755718/
我知道问题的标题听起来很奇怪,但我不知道该怎么调用它。 首先,我有一个网格布局,我希望我的 .search-wrapper 宽度为 50% 并向右浮动。在我的演示中 jsfiddle整个 .searc
我们正在使用 QA-C 来实现 MISRA C++ 一致性,但是该工具会为这样的代码喷出错误: float a = foo(); float b = bar(); float c = a - b; 据
考虑 float a[] = { 0.1, 0.2, 0.3}; 我很困惑a稍后传递给函数 foo(float* A) .不应该是 float* 类型的变量指向单个浮点数,对吗?就像这里提到的tu
这可能是我一段时间以来收到的最好的错误消息,我很好奇出了什么问题。 原代码 float currElbowAngle = LeftArm ? Elbow.transform.localRotation
刚开始学习 F#,我正在尝试为 e 生成和评估泰勒级数的前 10 项。我最初编写了这段代码来计算它: let fact n = function | 0 -> 1 | _ -> [1
我已经使用 Erlang 读取二进制文件中的 4 个字节(小端)。 在尝试将二进制转换为浮点时,我一直遇到以下错误: ** exception error: bad argument in
假设我有: float a = 3 // (gdb) p/f a = 3 float b = 299792458 // (gdb) p/f b = 29979244
我每次都想在浏览器顶部修复这个框。但是右边有一些问题我不知道如何解决所以我寻求帮助。 #StickyBar #RightSideOfStickyBar { float : right ; }
我正在研究 C# 编译器并试图理解数学运算规则。 我发现在两种不同的原始类型之间使用 == 运算符时会出现难以理解的行为。 int a = 1; float b = 1.0f; Cons
假设我有: float a = 3 // (gdb) p/f a = 3 float b = 299792458 // (gdb) p/f b = 29979244
Denormals众所周知,与正常情况相比,表现严重不佳,大约是 100 倍。这经常导致 unexpected软件 problems . 我很好奇,从 CPU 架构的角度来看,为什么非规范化必须是 那
我有一个由两个 float 组成的区间,并且需要生成 20 个随机数,看起来介于两个 float 定义的区间之间。 比方说: float a = 12.49953f float b = 39.1123
我正在构建如下矩阵: QMatrix4x3 floatPos4x3 = QMatrix4x3( floatPos0.at(0), floatPos1.at(0), floatPos2.at(0),
给定归一化的浮点数f,在f之前/之后的下一个归一化浮点数是多少。 通过微动,提取尾数和指数,我得到了: next_normalized(double&){ if mantissa is n
关于 CSS“float”属性的某些东西一直让我感到困惑。为什么将“float”属性应用到您希望 float 的元素之前的元素? 为了帮助可视化我的问题,我创建了以下 jsFiddle http://
关于 CSS“float”属性的某些东西一直让我感到困惑。为什么将“float”属性应用到您希望 float 的元素之前的元素? 为了帮助可视化我的问题,我创建了以下 jsFiddle http://
我有一个新闻源/聊天框。每个条目包含两个跨度:#user 和#message。我希望#user 向左浮动,而#message 向左浮动。如果#message 导致行超过容器宽度,#message 应该
我想创建一个“记分卡”网格来输出一些数据。如果每个 div.item 中的数据都具有相同的高度,那么在每个 div.item 上留下一个简单的 float 会提供一个漂亮的均匀布局,它可以根据浏览器大
我正在学习使用 CSS float 属性。我想了解此属性的特定效果。 考虑以下简单的 HTML 元素: div1 div2 This is a paragraph 以及以下 CSS 规则: div {
我正在尝试从可以是 int 或 float 的文件中提取数据。我发现这个正则表达式将从文件 (\d+(\.\d+)?) 中提取这两种类型,但我遇到的问题是它将 float 拆分为两个。 >>> imp
我是一名优秀的程序员,十分优秀!