- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我正在开发一个将 -1.0 到 1.0 范围内的 Float 样本转换为有符号 16 位的应用程序,以确保优化 (SSE) 例程的输出准确 我已经编写了一组运行非针对 SSE 版本优化的版本并比较它们的输出。
在我开始之前,我已经确认 SSE 舍入模式设置为最近。
在我的测试用例中,公式是:
ratio = 65536 / 2
output = round(input * ratio)
在大多数情况下,结果是准确的,但在一个特定的输入上,我发现输入 -0.8499908447265625
失败。
-0.8499908447265625 * (65536 / 2) = -27852.5
普通代码正确地将其舍入为 -27853
,但 SSE 代码将其舍入为 -27852
。
这是正在使用的 SSE 代码:
void Float_S16(const float *in, int16_t *out, const unsigned int samples)
{
static float ratio = 65536.0f / 2.0f;
static __m128 mul = _mm_set_ps1(ratio);
for(unsigned int i = 0; i < samples; i += 4, in += 4, out += 4)
{
__m128 xin;
__m128i con;
xin = _mm_load_ps(in);
xin = _mm_mul_ps(xin, mul);
con = _mm_cvtps_epi32(xin);
out[0] = _mm_extract_epi16(con, 0);
out[1] = _mm_extract_epi16(con, 2);
out[2] = _mm_extract_epi16(con, 4);
out[3] = _mm_extract_epi16(con, 6);
}
}
要求的自包含示例:
/* standard math */
float ratio = 65536.0f / 2.0f;
float in [4] = {-1.0, -0.8499908447265625, 0.0, 1.0};
int16_t out[4];
for(int i = 0; i < 4; ++i)
out[i] = round(in[i] * ratio);
/* sse math */
static __m128 mul = _mm_set_ps1(ratio);
__m128 xin;
__m128i con;
xin = _mm_load_ps(in);
xin = _mm_mul_ps(xin, mul);
con = _mm_cvtps_epi32(xin);
int16_t outSSE[4];
outSSE[0] = _mm_extract_epi16(con, 0);
outSSE[1] = _mm_extract_epi16(con, 2);
outSSE[2] = _mm_extract_epi16(con, 4);
outSSE[3] = _mm_extract_epi16(con, 6);
printf("Standard = %d, SSE = %d\n", out[1], outSSE[1]);
最佳答案
虽然 SSE 舍入模式默认为“舍入到最近”,但它不是我们在学校学到的熟悉的旧舍入方法,而是一种稍微更现代的变体,称为 Banker's rounding。 (又名无偏舍入、收敛舍入、统计学家舍入、荷兰式舍入、高斯舍入或奇偶舍入),舍入到最接近的偶数整数值。从统计的角度来看,这种舍入方法据说比更传统的方法更好。您将看到与 rint() 等函数相同的行为, 它也是 default rounding mode for IEEE-754 .
另请注意,标准库函数 round()使用传统的舍入方法,SSE指令ROUNDPS
(_mm_round_ps
)使用银行家舍入。
关于c++ - 上证所该向上舍入时向下舍入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33115186/
任何人都可以建议一种使用 SSE4.1 之前的 SIMD 计算 float 下限/上限的快速方法吗?我需要正确处理所有极端情况,例如当我有一个 float 值时,它不能用 32 位 int 表示。 目
我是一名优秀的程序员,十分优秀!