gpt4 book ai didi

c++ - OpenCV 双矩阵除以标量产生不正确的结果

转载 作者:太空宇宙 更新时间:2023-11-04 13:40:36 25 4
gpt4 key购买 nike

我很好奇是否有人能够在用标量 (double) 划分矩阵(具有 double 值)时得到正确的结果。当我试图追踪 MATLAB 中的算法与在 C++ 中重现的算法之间的一些不一致的根源时,我注意到 OpenCV 没有给出正确的(好吧,“准确的”)结果。这是我遇到的问题的一个最小示例:

cv::Mat some_matrix(1, 1, CV_64FC1, cv::Scalar::all(95));
cv::Mat some_matrix_div = some_matrix / 235.0;
printf(
"Expected: %.53g\n"
"OpenCV : %.53g\n",
some_matrix.at<double>(0,0) / 235.0,
some_matrix_div.at<double>(0,0) );

运行后我看到了

Expected: 0.40425531914893614304773450385255273431539535522460938
OpenCV : 0.404255319148936198558885735110379755496978759765625

第一个是值应该是什么(如果您在 C++ 或 MATLAB 中执行 95/235 的 double 除法,您将得到什么),第二个是 OpenCV 在使用除法运算符时产生的值。我尝试在 OpenCV 源代码中追踪问题,但矩阵运算有点复杂,我现在没有太多时间来研究它,所以我想知道是否有其他人遇到过这个问题并且知道解决办法?

编辑

我会添加一些说明。

首先,我知道 double 不是精确的数字表示。我所说的“精确”(为什么它在引号中)的意思是完全执行双除法(例如打印 95.0/235.0 的结果)与 OpenCV 将矩阵除以标量时所做的并不完全相同,尽管如此矩阵中的值确实存储为 double ,标量也确实被视为 double 。人们会期望这两个结果应该是相同的;也就是说,如果我将一个 double 除以另一个 double ,结果应该与 OpenCV double 矩阵除以一个 double 标量相同。

我也已经尝试在代码中将所有数字常量显式转换为 double ,但没有成功。

虽然在这种情况下确实存在差异(e^-16),但我不确定随着时间的推移,这可能会导致越来越大的错误。这是一个问题。另一个更像是一个小烦恼,误解了为什么 OpenCV 没有做人们直觉上期望的事情。最后它可能不会引起任何问题,但如果可以避免奇怪的行为,我显然更喜欢那样,特别是因为它使得计算不符合 MATLAB 结果的预期结果时不清楚,因为计算奇怪或因为实际的算法实现问题(这是我的假设)。

希望这更清楚。

最佳答案

float 学本质上是不精确的。在 x86 平台上,可以使用 FPU(80 位扩展精度)或 SSE/AVX vector 单元(64 位 double )计算 double 。在何处完成此计算取决于编译器的选择和传递给编译器的各种选项。更糟糕的是,如果编译器用完了 80 位寄存器,它会将结果作为 64 位结果“溢出”到内存中。事实证明,对于大多数浮点运算,甚至对于标量, vector 单元的速度都更快,因此在允许的情况下,编译器通常会首选它。

如果软件明确编写为使用 SSE 或 AVX 以获得最大速度,那么它肯定会使用 64 位版本。 OpenCV 可能就是这种情况。 OpenCV 甚至可能通过先计算倒数 (1.0/235.0) 来近似计算,然后将结果乘以每个像素,因为这样会快得多。

一些尝试:

some_matrix.at<double>(0,0) * (1.0 / 235.0)

同时尝试更改您的编译器标志以包含 -mfpmath=sse -msse2 以确保您的编译器知道您有一个 SSE 单元,并将其用于 double 。

阅读此处了解这些效果的详细说明:https://gcc.gnu.org/wiki/x87note

关于c++ - OpenCV 双矩阵除以标量产生不正确的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27787854/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com