gpt4 book ai didi

c++ - HOG 特征维度的大小

转载 作者:太空狗 更新时间:2023-10-29 22:59:37 26 4
gpt4 key购买 nike

我在试图理解本文中 HOG 特征的大小时感到困惑。 Mid-level Elements for Object Detection. .在Dalal的工作中,一个64*128像素的窗口是由一个4*9*7*15=3780维的HOG特征表示的。但是在这些论文中一个64*64像素的窗口是由一个6*6*31的HOG特征表示的。我已经阅读了其中引用的引用文献,但仍然不明白它是如何计算的。任何人都可以帮助我理解每 64*64 窗口提取 6*6*31 HOG 特征的想法吗?单元格大小、 block 大小和步幅是多少这篇论文?

最佳答案

你需要知道有两种不同的 HOG 特征。有 Dalal 建议的原始版本(图像被分成 block , block 被分成单元格,正如您在问题中所解释的那样)。第二个是 UoCTTI HoG 功能。

为了解释您的问题,让我首先解释数字 31。这是本文描述的 UoCTTI Hog 特征的维度(P. F. Felzenszwalb、R. B. Grishick、D. McAllester 和 D. Ramanan。对象detection with discriminatively trained part based models. PAMI, 2009).在本文中,他们使用 PCA 将维度从 36 减少到 13,然后他们执行不同类型的扩充以添加其余维度 (18)。 6x6 是将图像划分为单元格。

关于c++ - HOG 特征维度的大小,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36332061/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com