gpt4 book ai didi

c++ - 为什么 g++(4.6 和 4.7)将这个除法的结果提升为 double ?我能阻止吗?

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:45:41 25 4
gpt4 key购买 nike

我正在编写一些模板代码来对同时使用 float 和 double 的数值算法进行基准测试,以便与 GPU 实现进行比较。

我发现我的浮点代码速度较慢,在调查使用 Intel 的 Vtune Amplifier 后,我发现 g++ 正在生成额外的 x86 指令(cvtps2pd/cvtpd2ps 和 unpcklps/unpcklpd)以将一些中间结果从 float 转换为 double 然后再返回再次。此应用程序的性能下降了近 10%。

在使用标志 -Wdouble-promotion 编译后(顺便说一句,-Wall 或 -Wextra 不包含),果然 g++ 警告我结果正在提升。

我将其简化为如下所示的简单测试用例。请注意,C++ 代码的顺序会影响生成的代码。复合语句 (T d1 = log(r)/r;) 会产生警告,而分离版本不会 (T d = log(r); d/=r;)。

以下是用 g++-4.6.3-1ubuntu5 和 g++-4.7.3-2ubuntu1~12.04 编译的,结果相同。

编译标志是:

g++-4.7 -O2 -Wdouble-promotion -Wextra -Wall -pedantic -Werror -std=c++0x test.cpp -o test

#include <cstdlib>
#include <iostream>
#include <cmath>

template <typename T>
T f()
{
T r = static_cast<T>(0.001);

// Gives no double promotion warning
T d = log(r);
d/=r;
// Promotes to double
T d1 = log(r)/r;

return d+d1;
}

int main()
{
float f1 = f<float>();
std::cout << f1 << std::endl;
}

我意识到 c++11 标准允许编译器在这里自行决定。但为什么顺序很重要?

我能否明确指示 g++ 仅将 float 用于此计算?

编辑:由 Mike Seymour 解决。需要使用 std::log 来确保获取日志的重载版本,而不是调用 C double log(double)。没有为分隔语句生成警告,因为这是转换而不是促销。

最佳答案

问题是

log(r)

在此实现中,似乎全局命名空间中唯一的log 是C 库函数double log(double)。请记住,未指定 C++ 库中的 C 库头文件是否将它们的定义转储到全局命名空间以及 namespace std

你想要

std::log(r)

确保 C++ 库定义的额外重载可用。

关于c++ - 为什么 g++(4.6 和 4.7)将这个除法的结果提升为 double ?我能阻止吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18721295/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com