作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我了解如何处理分类问题并开始了解卷积网络,我认为这在某种程度上是答案。我对如何设置网络来提供输出位置有点困惑。
假设您拥有包含面部的数据集的 Nose 端点的位置。要找到终点,您只需做一个“分类”类型的问题,其中您的输出层类似于 64x64 = 4096 个点,但如果 Nose 位于网格的第 43 行和第 20 列点,您只需将输出设置为全零,除了对于在元素 43*64 + 20 = 2772 处,您将其设置为等于 1 吗?然后只需将其映射回您的图像尺寸即可。
我找不到太多关于这部分识别如何工作的信息,这是我最好的猜测。我正在用这种方法进行第二个项目,但这将是大量工作,并且想知道我是否至少走在正确的轨道上。这似乎是一个已解决的问题,但我似乎找不到人们如何做到这一点。
最佳答案
尽管您所描述的内容可行,但通常不使用神经网络(卷积网络和其他网络)来确定图像中特征的位置。特别是,卷积神经网络 (CNN) 专门设计为具有平移不变性,因此无论特征在输入图像中的位置如何,它们都会检测特征 - 这与您正在寻找的内容相反。
针对您所描述的此类问题,一种常见且有效的解决方案是级联分类器。它们有一些限制,但对于您所描述的应用程序类型,它可能会工作得很好。特别是,由于采用分阶段方法,级联分类器被设计为提供良好的性能,其中输入图像的大部分部分很快就会被前几个阶段消除。
不要误会我的意思,尝试使用您描述的方法可能会很有趣;请注意,要使其很好地扩展可能会很困难。
关于image - 如何让神经网络给出位置?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36489583/
我是一名优秀的程序员,十分优秀!