OpenCV Haar 级联分类器似乎使用 24x24 的人脸图像作为其正面训练数据。我有两个问题:
- 除了较大的训练图像需要更多处理之外,选择训练图像大小还有哪些考虑因素?
- 对于非正方形图像,some people已选择将一个维度保持在 24px,并根据需要扩展另一个维度(比如 100-200px)。这是正确的策略吗?
- 如何决定训练图像的大小(这是问题 1 的变体)
老实说,我相信有比图像大小更好的参数可以调整。即便如此,这是一个从精细到粗略检测的问题——在更精细的级别上,您可以获得细节,而在更粗糙的级别上,您可以获得结构。此外,还有一个权衡:对于 24x24 检测区域,大约有 160,000 个可能的矩形(haar 样)特征,因此增加或减少也会影响训练/测试的这个数字(这就是为什么使用提升来选择一个鉴别特征的一小部分)。
如您所说,这是因为他的目标不同(即一支笔)。我认为将先验纵横比信息引入级联训练是明智的,否则你会得到具有笔检测器方形边界框的检测,并且可能会影响性能,因为训练阶段正在拾取周围更大的背景区域笔。
查看我的第一个答案。我认为这主要是经验主义的。有一些用于特征缩放或构建图像金字塔的技术(例如,参见 this work)也降低了高度控制训练目标图像尺寸选择的有用性。
我是一名优秀的程序员,十分优秀!