gpt4 book ai didi

opencv - 计算 HOG 特征

转载 作者:太空宇宙 更新时间:2023-11-03 20:46:14 24 4
gpt4 key购买 nike

我在第二步中遇到一个问题,即为空间单元上的梯度方向累积加权投票。

假设单元格是8*8。让我用两个矩阵 GO[8][8]([1 9]), GM[8][8] 分别表示梯度方向和梯度幅度。梯度方向范围为 0 - 180,并且有 9 个方向 bin。

根据我对 HOG 的理解,对于单元格中的每个像素,将其梯度幅度添加到其对应的方向 bin 中。这样,我们就可以得到每个单元格的直方图。

但是有一句话让我很困惑。

"To reduce aliasing, votes(gradient magnitude) are interpolated trilinearly between the neighbouring bin centers in both orientation and position."1

为什么要插值?如何插值?有人可以解释更详细吗?没有减少别名。

提前致谢。


1 这句话出自 Navneet Dalal 的 PHD 论文,p38,第 4 行。

最佳答案

插值是计算直方图的标准技术。这里的想法是,每个值不是简单地放入一个 bin 中,而是根据它与原始 bin 中心的距离分布在两个相邻的 bin 之间(假设是一维直方图)。

这样做的目的是处理测量中的一个小错误可能导致将一个值放入不同的 bin 中的情况。假设您有 CPU 周期,这对任何类型的直方图都是一件非常好的事情,而不仅仅是 HOG。

2d 和 3d 直方图也有双线性和三线性插值,其中每个值分别分布在 4 和 8 个相邻的 bin 之间。

关于opencv - 计算 HOG 特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3519806/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com