gpt4 book ai didi

c++ - 上证所该向上舍入时向下舍入

转载 作者:可可西里 更新时间:2023-11-01 17:07:32 26 4
gpt4 key购买 nike

我正在开发一个将 -1.0 到 1.0 范围内的 Float 样本转换为有符号 16 位的应用程序,以确保优化 (SSE) 例程的输出准确 我已经编写了一组运行非针对 SSE 版本优化的版本并比较它们的输出。

在我开始之前,我已经确认 SSE 舍入模式设置为最近。

在我的测试用例中,公式是:

ratio = 65536 / 2
output = round(input * ratio)

在大多数情况下,结果是准确的,但在一个特定的输入上,我发现输入 -0.8499908447265625 失败。

-0.8499908447265625 * (65536 / 2) = -27852.5

普通代码正确地将其舍入为 -27853,但 SSE 代码将其舍入为 -27852

这是正在使用的 SSE 代码:

void Float_S16(const float *in, int16_t *out, const unsigned int samples)
{
static float ratio = 65536.0f / 2.0f;
static __m128 mul = _mm_set_ps1(ratio);

for(unsigned int i = 0; i < samples; i += 4, in += 4, out += 4)
{
__m128 xin;
__m128i con;

xin = _mm_load_ps(in);
xin = _mm_mul_ps(xin, mul);
con = _mm_cvtps_epi32(xin);

out[0] = _mm_extract_epi16(con, 0);
out[1] = _mm_extract_epi16(con, 2);
out[2] = _mm_extract_epi16(con, 4);
out[3] = _mm_extract_epi16(con, 6);
}
}

要求的自包含示例:

/* standard math */
float ratio = 65536.0f / 2.0f;
float in [4] = {-1.0, -0.8499908447265625, 0.0, 1.0};
int16_t out[4];
for(int i = 0; i < 4; ++i)
out[i] = round(in[i] * ratio);

/* sse math */
static __m128 mul = _mm_set_ps1(ratio);
__m128 xin;
__m128i con;

xin = _mm_load_ps(in);
xin = _mm_mul_ps(xin, mul);
con = _mm_cvtps_epi32(xin);

int16_t outSSE[4];
outSSE[0] = _mm_extract_epi16(con, 0);
outSSE[1] = _mm_extract_epi16(con, 2);
outSSE[2] = _mm_extract_epi16(con, 4);
outSSE[3] = _mm_extract_epi16(con, 6);

printf("Standard = %d, SSE = %d\n", out[1], outSSE[1]);

最佳答案

虽然 SSE 舍入模式默认为“舍入到最近”,但它不是我们在学校学到的熟悉的旧舍入方法,而是一种稍微更现代的变体,称为 Banker's rounding。 (又名无偏舍入、收敛舍入、统计学家舍入、荷兰式舍入、高斯舍入或奇偶舍入),舍入到最接近的偶数整数值。从统计的角度来看,这种舍入方法据说比更传统的方法更好。您将看到与 rint() 等函数相同的行为, 它也是 default rounding mode for IEEE-754 .

另请注意,标准库函数 round()使用传统的舍入方法,SSE指令ROUNDPS (_mm_round_ps)使用银行家舍入。

关于c++ - 上证所该向上舍入时向下舍入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33115186/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com