gpt4 book ai didi

image-processing - 对定向梯度直方图的理解

转载 作者:行者123 更新时间:2023-12-04 07:22:53 24 4
gpt4 key购买 nike

我正在学习 HOG,我是从 here 了解它的.带有示例的解释清楚的页面。我不理解这个概念,它是如何工作的

A 16×16 block has 4 histograms which can be concatenated to form a 36 x 1 element vector and it can be normalized just the way a 3×1 vector is normalized.

这个36*1是怎么来的,我们是怎么计算出来的?我们总是需要 9 bin 向量是强制性的吗? HOG 的大小是固定的吗?

来了吗?

最佳答案

Is it compulsory that we always need 9 bin vector?

不一定。 Dalal 和 Triggs 在 their original HOG paper 中说明当使用多达 9 个 bin 时,他们的应用(行人检测)的准确度提高了,之后准确度没有进一步提高,这就是为什么通常使用 9 个。

How this 36*1 came and how we calculated it?

正如评论中已经指出的那样:

每个直方图有 9 个 bin(每个都是特征向量中的标量值)。在您的示例中,直方图是使用 8 x 8 block 计算的,这意味着在 16 x 16 block 中您将能够计算 4 个直方图 .每个直方图都会产生一个 9 x 1 特征向量,因此:

4(直方图)* 9(分箱)= 36 x 1 特征向量。

您基本上只是将结果连接到一个向量中。

关于image-processing - 对定向梯度直方图的理解,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55444374/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com