- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我已经阅读了 2004 年的 viola 论文。在 3.1 中,他们解释了阈值计算。但我非常困惑。它读作
For each feature, the examples are sorted based on feature value
问题1)排序列表是从实例的积分图像计算的haar特征值列表。因此,如果我们有一个特征和 10 张图像(正面和负面)。我们得到与每个输入图像相关的 10 个结果。
The AdaBoost optimal threshold for that feature can then be computed in a single pass over this sorted list. For each element in the sorted list, four sums are maintained and evaluated: the total sum of positive example weights T +, the total sum of negative example weights T −, the sum of positive weights below the current example S+ and the sum of negative weights below the current example S−
问题2)排序的目的是什么。我想最高的那个是最能描述图像的那个。但从算法上讲,它如何影响 (S- S+ T+ T-)。
问题 3) 现在对于一个排序列表,我们计算 (S- S+ T+ T-)。这是否意味着每个条目都有自己的 (S- S+ T- T+) 还是只有一个 (S- S+ T- T+) 用于整个列表。
The error for a threshold which splits the range between the current and previous example in the sorted list is: e = min ( S+ + (T − − S−), S− + (T + − S+)) ,
问题 4) 这在某种程度上回答了我之前的问题,但我不确定。因此,为了让我们对每个输入图像都有“e”。我们需要为列表中的每个条目维护 (S- S+ T- T+)。但是,在我们为该特征计算了 N 个(每个图像一个)之后,我们如何处理“e”。
提前致谢,如果这让我感到困惑或者您需要对我的问题进行更多说明,请告诉我。
最佳答案
Question1) Is sorted list a list of haar feature values calculated from integral image of examples. So if we have a feature and 10 images(positive and negative). We get 10 results associated with each input image.
您将获得 10 个该特征的结果,一个结果与每个输入图像相关联。每张图片都被标记为正面或负面。
Question 2) what is the purpose of sorting. I guess the one with the highest is the one describes the image best. But algorithmically how does it affect (S- S+ T+ T-).
具有最高的图像是对该特征具有最高响应的图像。您根据响应而不是权重进行排序。
你对它们进行排序的原因是你试图计算的两件事是“当前示例 S+ 以下的正权重总和和当前示例 S− 以下的负权重总和”。如果列表已排序,那么您可以保留一个运行总和,并且在每个点上,您已将其权重添加到总和的所有示例的特征响应都小于(即“低于”)当前示例。如果列表未排序,那将不起作用。然后,您可以评估与使用该示例和下一个示例之间的中间响应级别作为阈值相关的错误。
Question3) Now for a sorted list we calculate (S- S+ T+ T-). Does this mean each entry holds its own (S- S+ T- T+) or is there only One (S- S+ T- T+) for the whole list.
每个示例将有一个 S- 和一个 S+,因为它是“低于当前示例的正权重总和”。 T+ 和 T- 是为整个列表计算的,我不知道为什么他们说你需要为每个元素维护它。
Question4) This somewhat answers my previous question but I am not sure. So in order for us have "e "for each input image. We need to maintain (S- S+ T- T+) for each entry in the list. But what do we do with "e" after we calculate N of them (one for each image) for that feature.
您从所有这些中选择了最小值,这是放置阈值的最佳位置(这将是这两个示例响应的中点),因为它具有最小误差(误报 + 漏报) .顺便说一句,每个点有两个选择的原因(即 e = min ( S+ + (T − − S−), S− + (T + − S+)) )是你可以选择是否设置阈值,以便高于该响应水平的值被认为是正的(第一项),或低于它的值被认为是正的。
如果是前者,则 S+ 是您的误报,(T- - S-) 是您的误报。如果是后者,则 S- 是您的假阴性,(T+ - S+) 是您的假阳性。
关于algorithm - Viola Jones 阈值 Haar 特征误差值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39109848/
这是有关的Viola-Jones算法(用于面部检测)的问题,如此处所述 http://en.wikipedia.org/wiki/Viola%E2%80%93Jones_object_detectio
我刚刚开始研究 Viola-Jones 人脸检测算法来设计人脸识别系统。根据我所了解的所有内容,我对“像素总和”这个短语感到困惑。是指给定像素点的颜色总和还是给定像素点的距离总和? 最佳答案 通常,如
请用几句话向我解释一下 Viola-Jones 人脸检测方法的工作原理。 最佳答案 Viola-Jones 检测器是一个强大的二元分类器构建了几个弱探测器 Each weak detector is
我正在实现 Viola-Jones 人脸检测器来检测静止图像中的人脸,它对于与我的训练尺寸相同的图像非常有效。但是我不知道人脸检测器如何处理多种尺寸的人脸? 如果我的图像的训练大小是 24*24 并且
我正在尝试在 OpenCV 中使用 Viola–Jones 人脸检测算法。我使用 detectMultiScale() 来定位图像中的多个面孔。我想知道如何从源代码返回或计算所计算面部的置信度。似乎默
我在理解 Viola Jones algorithm 的训练阶段时遇到问题. 据我所知,我用伪代码给出了算法: # learning phase of Viola Jones foreach feat
据说“4916 个正面训练示例经过手工挑选对齐、归一化并缩放到 24x24 的基本分辨率。通过从 9500 张不包含人脸的图像中随机挑选子窗口来选择 10,000 个负面示例。”在论文“Paul Vi
我尝试从面部数据库中提取面部特征,但我发现 Viola-Jones 算法在两种情况下效果不佳*: 当我尝试单独检测眼睛时, 当我尝试检测嘴巴时。 *效果不佳:将图像的不同部分检测为眼睛或嘴巴。或者有时
我正在努力理解 Viola Jones 方法,而且我基本上已经掌握了它。 它使用简单的类似 Haar 的特征提升到强大的分类器中并组织成层/级联以实现更好的性能(不用理会明显的“非对象”区域)。 我想
我看过很多关于 Viola-Jones 算法真正工作原理的文章和问题的答案。我一直在寻找答案,说某个区域的“像素总和”减去相邻区域的“像素总和”。我对“像素总和”的含义感到困惑。值(value)依据是
我已经阅读了 2004 年的 viola 论文。在 3.1 中,他们解释了阈值计算。但我非常困惑。它读作 For each feature, the examples are sorted based
我一直在实现 Viola-Jones' face detection algorithm 的改编版.该技术依赖于在图像中放置一个 24x24 像素的子帧,然后在其中的每个位置以各种可能的尺寸放置矩形特
我读了很多关于 Viola Jones 方法的文章,但我仍然不明白矩形特征中的“弱分类器”、“强分类器”、“子窗口”,它们的定义是什么。那么“阈值”呢?我如何知道阈值?谁能帮我?谢谢之前 最佳答案 A
我正在尝试使用 OpenCV 中的 Haar 级联检测图像中的特定对象。 假设我对检测风景图像中的 parking 标志感兴趣。在为我的训练集定义正图像样本时,哪种图像是最好的图像:(a) 包含我的对
我现在正在比较用纯 C 代码编写的代码和使用 openCV 函数 cvHaarDetectObjects() 的代码之间的 Viola-Jones 代码的时间性能。 到目前为止,用纯C代码检测人脸的时
我想通过并行提取检测到的人脸来加速 Viola-Jones,我使用了这段代码,但是 For Each 语句中的人脸参数有一个错误,你能告诉我如何解决这个错误吗?错误是 (Error 2 The typ
我正在使用 Viola 和 Jones 算法在 C 中实现功能性人脸检测算法。我无法理解 Adaboost 来训练强大的分类器。 我可以检测单个图像中的所有 5 个基本 haar 特征(24x24 图
我正在尝试了解 Viola-jones 人脸检测算法。在论文中,他们提到在 24x24 像素的图像中可以有 160k 以上的 haar 特征。 我正在努力理解如何确定弱分类器。例如,如果我有 10k
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 5 年前。 Improve this qu
我正在尝试用 C++ 实现 P. Viola 和 M. Jones 检测框架(一开始只是简单的序列分类器 - 不是级联版本)。我认为我已经设计了所有必需的类和模块(例如积分图像、Haar 特征),尽管
我是一名优秀的程序员,十分优秀!