- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我最近一直在做一些分析,我遇到了一个让我抓狂的案例。以下是一段不安全的 C# 代码,它基本上将源样本缓冲区复制到具有不同采样率的目标缓冲区。就像现在一样,它占每帧总处理时间的 0.17%。我没有得到的是,如果我使用 float 而不是 double ,处理时间将增加到 0.38%。有人可以解释一下这里发生了什么吗?
快速版本 (~17%)
double rateIncr = ...
double readOffset = ...
double offsetIncr = ...
float v = ... // volume
// Source and target buffers.
float* src = ...
float* tgt = ...
for( var c = 0; c < chunkCount; ++c)
{
for( var s = 0; s < chunkSampleSize; ++s )
{
// Source sample
var iReadOffset = (int)readOffset;
// Interpolate factor
var k = (float)readOffset - iReadOffset;
// Linearly interpolate 2 contiguous samples and write result to target.
*tgt++ += (src[ iReadOffset ] * (1f - k) + src[ iReadOffset + 1 ] * k) * v;
// Increment source offset.
readOffset += offsetIncr;
}
// Increment sample rate
offsetIncr += rateIncr;
}
慢速版本 (~38%)
float rateIncr = ...
float readOffset = ...
float offsetIncr = ...
float v = ... // volume
// Source and target buffers.
float* src = ...
float* tgt = ...
for( var c = 0; c < chunkCount; ++c)
{
for( var s = 0; s < chunkSampleSize; ++s )
{
var iReadOffset = (int)readOffset;
// The cast to float is removed
var k = readOffset - iReadOffset;
*tgt++ += (src[ iReadOffset ] * (1f - k) + src[ iReadOffset + 1 ] * k) * v;
readOffset += offsetIncr;
}
offsetIncr += rateIncr;
}
奇数版本(~22%)
float rateIncr = ...
float readOffset = ...
float offsetIncr = ...
float v = ... // volume
// Source and target buffers.
float* src = ...
float* tgt = ...
for( var c = 0; c < chunkCount; ++c)
{
for( var s = 0; s < chunkSampleSize; ++s )
{
var iReadOffset = (int)readOffset;
var k = readOffset - iReadOffset;
// By just placing this test it goes down from 38% to 22%,
// and the condition is NEVER met.
if( (k != 0) && Math.Abs( k ) < 1e-38 )
{
Console.WriteLine( "Denormalized float?" );
}
*tgt++ += (src[ iReadOffset ] * (1f - k) + src[ iReadOffset + 1 ] * k) * v;
readOffset += offsetIncr;
}
offsetIncr += rateIncr;
}
我现在只知道我什么都不知道
最佳答案
您是在 64 位还是 32 位处理器上运行它?我的经验是,在某些边缘情况下,如果对象的大小与寄存器的大小相匹配,CPU 可以使用这样的低级功能进行优化(即使您可能假设两个 float 可以很好地适合 64 位注册您可能仍然会失去优化优势)。如果你在 32 位系统上运行它,你可能会发现情况相反......
快速搜索和我能做的最好的引用是 C++ 游戏开发论坛的几个帖子(在我从事游戏开发的一年中,我自己注意到了这一点,但那是唯一一次我正在分析到这个级别)。 This post从 C++ 方法中获得了一些有趣的反汇编结果,这些结果可能适用于非常低的级别。
另一个想法:
This article来自 MSDN 的文章详细介绍了在 .NET 中使用 float 的许多内部细节,主要是为了解决 float 比较的问题。其中有一个有趣的段落总结了处理浮点值的 CLR 规范:
This spec clearly had in mind the x87 FPU. The spec is basically saying that a CLR implementation is allowed to use an internal representation (in our case, the x87 80 bit representation) as long as there is no explicit storage to a coerced location (a class or valuet type field), that forces narrowing. Also, at any point, the IL stream may have conv.r4 and conv.r8 instructions, which will force the narrowing to happen.
因此,当对它们执行操作时,您的 float 实际上可能不是 float ,而是它们可能是 x87 FPU 上的 80 位数字或编译器可能认为优化或计算精度所需的任何其他内容。如果不查看 IL,您将无法确定,但是当您使用 float 时可能会有很多代价高昂的转换,而当您使用 double 时不会命中。遗憾的是,您无法像在 C++ 中通过 fp 开关那样在 C# 中定义浮点运算所需的精度,因为这会阻止编译器在操作之前将所有内容放入更大的容器中。
关于c# - 为什么在这个例子中使用 float 比使用 double 慢 2 倍?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/862846/
下面的代码有效,我觉得double(double)和double(*)(double)没有区别,square和 &square,我说得对吗? #include double square(doubl
我知道我的作业很草率,这是我在这门课上的第 4 次作业。任何帮助将不胜感激,谢谢。 double getPrincipal(0); double getRate(0); double getYe
我遇到了那个错误,当我使用类时,我在使用函数指针时遇到了这个错误。我的函数'ope'函数我该如何解决 evaluator::function(){ double (*ope) (dou
问题://故事从哪里开始 Graphics 类型中的方法 drawLine(int, int, int, int) 不适用于参数 (double, double, double, double) g.
我有一张 map> m1 形式的 map .我可以将其复制到 map m2 形式的 map 吗?这样键是相同的,并且 m2 中的值是 get(m1->second) 不使用循环?谢谢! 最佳答案 这样
有没有办法获取vector> 的“.first”和“.second”的连续内存? ?我的意思是: void func(int N, double* x, double* y) { for (i
我正在尝试将自定义 lambda 传递给需要函数指针的函数(更准确地说是 zero 中的 Brent library 函数)。 我的想法是,我将使用参数创建一次 lambda,然后用多个值对其求值 x
这是一个很简单的问题,让我很困惑。 我收到一个源文件的以下错误,但另一个没有: 4 src/Source2.cpp:1466: error: no matching function for cal
struct CalculatorBrain { private var accumulator: Double? func changeSign(operand: Double) -
在我正在进行的项目中,我尝试使用 curlpp库来发出一个简单的 html GET 请求。当我将 cpp 文件传递给 g++ 时,出现以下错误: /usr/local/include/curlpp
不使用double就能获得quadruple精度超过16位的数字吗?如果可能的话,这取决于编译器还是其他?因为我知道有人说他使用double精度,并且具有22位精度。 最佳答案 数据类型double
我正在寻找有关特斯拉 GPU 中硬件如何实现 double 的信息。我读到,两个流处理器正在处理单个 double 值,但我没有找到 nvidia 的任何官方论文。 提前致谢。聚苯硫醚为什么大多数 G
这个问题在这里已经有了答案: Passing capturing lambda as function pointer (10 个答案) 关闭 2 年前。 我有这个错误 error: cannot
情况:我有一个元组列表,其中添加了一个元组: List> list = new List>(); list .Add(new Tuple(2.2, 6.6)); 一切似乎都还好。但是......在 D
我有一个 JList,里面有一堆名字,还有一个包含这些名字值的数组 final Double[] filmcost = { 5.00, 5.50, 7.00, 6.00, 5.00 }; 我想做的是,
我试图找出牛顿法来求方程的根。这个错误出来了,我无法处理。 double fn(double n){ return sin(n)+log(n)-1; } double f1n(double n
我有一个 junit 测试断言两个 Double 对象,具有以下内容: Assert.assertEquals(Double expected, Double result); 这很好,然后我决定将其
我正在尝试引入部分数据文件来填充数组,用户尝试了三次输入正确的数据文件名。我一再遇到这些错误。我知道像 arr 这样的数组只是一个指向内存块的指针。 #include #include #incl
我正在尝试完成复习题(为即将到来的编程决赛),但是,我无法解决这个问题,因为我不断收到错误(标题)。正如预期的那样,我将发布问题和我尝试的解决方案。 问题: 给定以下函数定义:void swap(do
任何人都知道如何实现这一目标。我已经尝试了通常的公式,但我只得到正数 Double.NEGATIVE_INFINITY) return d; } } 这将以相同的概率
我是一名优秀的程序员,十分优秀!