- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在使用 Mono 在 C# 中实现一些 32 位浮点三角函数,希望使用 Mono.Simd。我目前只缺少固体范围减少。我现在有点卡住了,因为显然 Mono's SIMD extensions不包括 float 和整数之间的转换,这意味着我无法使用通常的方法进行舍入/截断。但是,我可以在整数和 float 之间按位转换。
这样的事情能做吗?如果需要,我可以上下缩放域,但理想情况下,范围缩小应该导致域为 [0, 2 pi] 或 [-pi, pi]。我有一种预感,如果域是 2 的幂,就可以用指数做一些 IEEE 魔法,但我真的不确定如何去做。
编辑:好吧,我试过弄乱这个 C 代码,感觉就像我在某事的边缘(它不起作用但小数部分总是正确的,至少在十进制/base10 中......)。核心原则似乎是获取你的域和输入指数之间的指数差异,并用移位的尾数和调整后的指数组成一个新的 float 。但它不适用于负数,我不知道如何处理2 的非幂(或任何小数 - 事实上,除 2 以外的任何东西都不起作用!)。
// here's another more correct attempt:
float fmodulus(float val, int domain)
{
const int mantissaMask = 0x7FFFFF;
const int exponentMask = 0x7F800000;
int ival = *(int*)&val;
int mantissa = ival & mantissaMask;
int rawExponent = ival & exponentMask;
int exponent = (rawExponent >> 23) - (129 - domain);
// powers over one:
int p = exponent;
mantissa <<= p;
rawExponent = exponent >> p;
rawExponent += 127;
rawExponent <<= 23;
int newVal = rawExponent & exponentMask;
newVal |= mantissa & mantissaMask;
float ret = *(float*)&newVal;
return ret;
}
float range_reduce(float value, int range )
{
const int mantissaMask = 0x7FFFFF;
const int exponentMask = 0x7F800000;
int ival = *(int*)&value;
// grab exponent:
unsigned exponent = (ival & exponentMask) >> 23;
// grab mantissa:
unsigned mantissa = ival & mantissaMask;
// remove bias, and see how much the exponent is over range/domain
unsigned char erange = (unsigned char)(exponent - (125 + range));
// check if sign bit is set - that is, the exponent is under our range
if (erange & 0x80)
{
// don't do anything then.
erange = 0;
}
// shift mantissa (and chop off bits) by the reduced amount
int inewVal = (mantissa << (erange)) & mantissaMask;
// add exponent, and subtract the amount we reduced the argument with
inewVal |= ((exponent - erange) << 23) & exponentMask;
// reinterpret
float newValue = *(float*)&inewVal;
return newValue;
//return newValue - ((erange) & 0x1 ? 1.0f : 0.0f);
}
int main()
{
float val = 2.687f;
int ival = *(int*)&val;
float correct = fmod(val, 2);
float own = range_reduce(val, 2);
getc(stdin);
}
编辑 2:
好吧,我真的想从 IEEE 二进制系统的角度来理解这一点。如果我们这样写模运算:
output = input % 2
[exponent] + [mantissa_bit_n_times_exponent]
3.5 = [2] + [1 + 0.5] ->[1] + [0.5] = 1.5
4.5 = [4] + [0 + 0 + 0.5] ->[0.5] + [0] = 0.5
5.5 = [4] + [0 + 1 + 0.5] ->[1] + [0.5] = 1.5
2.5 = [2] + [0 + 0.5] ->[0.5] + [0] = 0.5
2.25 = [2] + [0 + 0 + 0.25] ->[0.25] = 0.25
2.375 = [2] + [0 + 0 + 0.25 + 0.125] ->[0.25] + [0.125] = 0.375
13.5 = [8] + [4 + 0 + 1 + 0.5] ->[1] + [0.5] = 1.5
56.5 = [32] + [16 + 8 + 0 + 0 + 0 + 0.5] ->[0.5] = 0.5
我们可以看到所有情况下的输出都是一个新数,没有原始指数,尾数移动了一个量(基于指数和第一个指数后尾数的第一个非零位- 尾数的位被忽略)到指数中。但我不确定这是否是正确的方法,它在纸面上效果很好。
编辑3:我卡在单声道版本 2.0.50727.1433
最佳答案
您可以将问题简化为取 float mod 1。为简化此操作,您可以使用位运算计算 float 的底数,然后使用浮点减法。以下是这些操作的(不安全)C# 代码:
// domain is assumed to be positive
// returns value in [0,domain)
public float fmodulus(float val, float domain)
{
if (val < 0)
{
float negative = fmodulus(-val, domain);
if (domain - negative == domain)
return 0;
else
return domain-negative;
}
if (val < domain)
return val; // this avoids losing accuracy
return fmodOne(val / domain) * domain;
}
// assumes val >= 1, so val is positive and the exponent is at least 0
unsafe public float fmodOne(float val)
{
int iVal = *(int*)&val;
int uncenteredExponent = iVal >> 23;
int exponent = uncenteredExponent - 127; // 127 corresponds to 2^0 times the mantissa
if (exponent >= 23)
return 0; // not enough precision to distinguish val from an integer
int unneededBits = 23 - exponent; // between 0 and 23
int iFloorVal = (iVal >> unneededBits) << unneededBits; // equivalent to using a mask to zero the bottom bits of the mantissa
float floorVal = *(float*)&iFloorVal; // convert the bit pattern back to a float
return val-floorVal;
}
例如,fmodulus(100.1f, 1) 是 0.09999847。 100.1f的位模式是
0 10000101 10010000011001100110011
floorVal(100f)的位模式是
0 10000101 10010000000000000000000
浮点减法给出接近 0.1f 的值:
0 01111011 10011001100110000000000
实际上,我很惊讶最后 8 位被清零了。我认为只有 0.1f 的最后 6 位应该被替换为 0。也许可以比依赖浮点减法做得更好。
关于c# - 浮点范围缩减,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29440450/
我目前正在学习使用 C 和 OpenMP 进行并行编程。 我想编写简单的代码,其中两个共享值由多个线程递增。 首先我使用了减少指令,它按预期工作。然后我改用 关键 启动关键部分的指令 - 它也有效。
我在用 kubectl scale --replicas=0 -f deployment.yaml 停止我所有正在运行的 pod 。请让我知道是否有更好的方法将所有正在运行的 pod 降到零,保持配置
请考虑我从教程中获得的以下代码和随附的解释性图像。其目的是演示 CUDA 的并行缩减。 #include "cuda_runtime.h" #include "device_launch_parame
我有以下“Frankenstein”和减少代码,部分来自 common CUDA reduction slices ,部分来自 CUDA 示例。 __global__ void reduce
学习openMP // array b #pragma omp parallel for // reduction(&&: b[i])? for (i=2; i<=N; i++
我目前正在使用以下 Reduction 函数通过 CUDA 对数组中的所有元素求和: __global__ void reduceSum(int *input, int *input2, int *i
假设我有两个 numpy 数组,形状为 (d, f) 的 A 和形状为 (d,) 的 I 包含 0..n 中的索引,例如 I = np.array([0, 0, 1, 0, 2, 1]) A = np
我有一个例程,它使用一个循环来计算给定下方粒子表面的粒子的最小高度。此例程尝试随机位置并计算最小高度,然后返回 x, y, z 值,其中 z 是找到的最小高度。 此例程可以与omp parallel
每个视频都有一个有趣的时刻集合,每个时刻代表一个截屏有趣的时间或代表整个标题的时间。请注意,boxarts 和 interestingMoments 数组都位于树中的相同深度。使用 Array.zip
我有一个 ImageIcon,用作打开此 skillsFrame 的按钮。此图像大小为 100x100 像素。正如您在屏幕截图中看到的那样,如果我只是放置图像,它太大了(这是预期的)。 我的问题是关于
我的任务是从 [[a]] 矩阵中获取一列。 一个简单的解决方案是 colFields :: Int -> [[a]] -> [a] colFields n c = map (!! n) c 当减少一级
问题是:如果我输入 hadoop jar MY.jar name_my_class /用户/用户/输入/用户/用户/输出 我需要的所有类都在MY.jar中,为什么我仍然收到错误 java.lang.N
我正在尝试使用 Nodejs、mongoose 和 MongoDB 来进行映射缩减操作。我有一个相当平坦的模式结构,我想获取每个“命名”对象的值/日期对列表。 map 缩减功能显然有问题,但我不知道如
我在 DigitalOcean 中设置了一个 Kubernetes 集群。集群配置为使用 HPA(Horizontal Pod Autoscaler)自动扩展。我想防止终止在过去 1 小时内按比例
IBM Cloudant NoSQL 对每秒的查找、写入、查询有一些限制。 在CloudAnt上我可以编写一个DesignDocument“View”。 当我读取一个 View 时,该读取会对哪里产生
就目前情况而言,这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放,visit
我最近刚刚开始使用 Python 编码,还有很多东西需要学习。我的代码的目标是从单元格中提取字符串,检查其字符长度并用特定缩写替换单词。然后,我将新字符串写入另一个 Excel 工作表中,并在所有数据
我有一个以下形式的 map : Map> START 让 INNER 成为内部映射,即 Map 例如,我想在新 map 中缩小 START map Map END 它们具有相同的键,但具有不同的值。特
给定以下 lambda 表达式,其中 \ 类似于 lambda: (\kf.f(\c.co)km)(\x.dox)(\le.le) 如果我将(\c.co)k转换成ko是不是错了?我这样做了,显然,这是
从 OpenMP 4.0 开始,支持用户定义的缩减。所以我在 C++ 中完全从 here 定义了对 std::vector 的归约。 .它适用于 GNU/5.4.0 和 GNU/6.4.0,但它返回随
我是一名优秀的程序员,十分优秀!