gpt4 book ai didi

opencv - OpenCV SURF比较描述符

转载 作者:行者123 更新时间:2023-12-02 16:50:15 25 4
gpt4 key购买 nike

以下片段来自 OpenCV find_obj.cpp,这是使用 SURF 的演示,

double
compareSURFDescriptors( const float* d1, const float* d2, double best, int length )
{
double total_cost = 0;
assert( length % 4 == 0 );
int i;
for( i = 0; i best )
break;
}
return total_cost;
}


据我所知,它检查欧几里得距离,我不明白为什么它以4组为一组呢?为什么不立即计算整个事情呢?

最佳答案

通常这样做是为了使SSE优化成为可能。 SSE寄存器的长度为128位,可以包含4个浮点数,因此您可以使用一条指令并行执行4次减法。

另一个好处是:仅在每四个差异之后才需要检查循环计数器。即使编译器不利用此机会生成SSE代码,这也可以使代码更快。例如,VS2008没有,甚至没有使用-O2:


双倍t0 = d1 [i]-d2 [i];
00D91666 FLD DWORD PTR [EDX-0CH]
00D91669 fsub dword ptr [ecx-4]
双倍t1 = d1 [i + 1]-d2 [i + 1];
00D9166C fld dword ptr [ebx + ecx]
00D9166F fsub dword ptr [ecx]
双倍t2 = d1 [i + 2]-d2 [i + 2];
00D91671 fld dword ptr [edx-4]
00D91674 fsub dword ptr [ecx + 4]
双倍t3 = d1 [i + 3]-d2 [i + 3];
00D91677 FLD DWORD PTR [EDX]
00D91679 fsub dword ptr [ecx + 8]
total_cost + = t0 * t0 + t1 * t1 + t2 * t2 + t3 * t3;
00D9167C FLD ST(2)
00D9167E fmulp st(3),st
00D91680 FLD ST(3)
00D91682 Fmulp ST(4),ST
00D91684 FXST ST(2)
00D91686 faddp st(3),st
00D91688 fmul st(0),st
00D9168A faddp st(2),st
00D9168C fmul st(0),st
00D9168E faddp st(1),st
00D91690 faddp st(2),st

关于opencv - OpenCV SURF比较描述符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4917887/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com