gpt4 book ai didi

algorithm - HOG 直方图 Bins 的三线性插值说明

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:08:39 25 4
gpt4 key购买 nike

像我之前的其他人一样HOG Trilinear Interpolation of Histogram Bins我正在尝试理解和实现 HoG 的三线性插值。 Dalal 的论文在这里:

http://lear.inrialpes.fr/people/dalal/NavneetDalalThesis.pdf

我很难理解的问题是,据我所知,任务是将值(value)重新分配到 bin 中,而不是已知 bin 值的插值。我清楚方向维度的一维情况;

例如,如果我有一个已知的 75 像素梯度方向值和 z1=60z2=80 (bin步长 b=20),则像素值(在本例中为梯度幅度,例如 w=16)将以 1:3 的比例分布 进入相邻的 bin(4 进入 60 bin,12 进入 80 bin)对吗?

当谈到需要幅度空间插值的三维情况时,我很难过。我不明白如何将幅度重新分配到适当的箱子。对于公认速度较慢的人的任何明确解释,将不胜感激。

最佳答案

Histogram of Oriented Gradients 正如 Navneet Dalal 所讨论的那样,讨论了将单元格的梯度大小插值到方向 bin 中(对于 0 到 180 度,我们有 9 个 bin 步长或带宽为 20 度的 bin)

一种天真的方法是只对窗口/图像中的每个单元格执行此操作,但这会导致混叠效果。为了减少混叠,讨论了应该将图像划分为 n x n 单元格的 block (最好是重叠的)。
例如。对于 64 x 128 像素的图像,您可以定义以下内容:
1. 单元格大小 = 8x8 像素
2. block 大小 = 2x2 单元格

这给出:
8x16 单元格,或
4x8 非重叠 block 或
步幅为 8 的 7x15 block ,即 7x15 50% 重叠 block

因此,与其单独对每个单元格执行线性直方图插值,不如对 block 中的单元格执行三线性插值,即三线性插值:
- 双线性进入( block 的)空间单元
- 线性进入方向箱

HoG 三线性插值的可视化: http://www.ultraimg.com/d7km

关于algorithm - HOG 直方图 Bins 的三线性插值说明,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17738534/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com