gpt4 book ai didi

image - 如何让神经网络给出位置?

转载 作者:行者123 更新时间:2023-11-30 08:36:31 25 4
gpt4 key购买 nike

我了解如何处理分类问题并开始了解卷积网络,我认为这在某种程度上是答案。我对如何设置网络来提供输出位置有点困惑。

假设您拥有包含面部的数据集的 Nose 端点的位置。要找到终点,您只需做一个“分类”类型的问题,其中您的输出层类似于 64x64 = 4096 个点,但如果 Nose 位于网格的第 43 行和第 20 列点,您只需将输出设置为全零,除了对于在元素 43*64 + 20 = 2772 处,您将其设置为等于 1 吗?然后只需将其映射回您的图像尺寸即可。

我找不到太多关于这部分识别如何工作的信息,这是我最好的猜测。我正在用这种方法进行第二个项目,但这将是大量工作,并且想知道我是否至少走在正确的轨道上。这似乎是一个已解决的问题,但我似乎找不到人们如何做到这一点。

最佳答案

尽管您所描述的内容可行,但通常不使用神经网络(卷积网络和其他网络)来确定图像中特征的位置。特别是,卷积神经网络 (CNN) 专门设计为具有平移不变性,因此无论特征在输入图像中的位置如何,它们都会检测特征 - 这与您正在寻找的内容相反。

针对您所描述的此类问题,一种常见且有效的解决方案是级联分类器。它们有一些限制,但对于您所描述的应用程序类型,它可能会工作得很好。特别是,由于采用分阶段方法,级联分类器被设计为提供良好的性能,其中输入图像的大部分部分很快就会被前几个阶段消除。

不要误会我的意思,尝试使用您描述的方法可能会很有趣;请注意,要使其很好地扩展可能会很困难。

关于image - 如何让神经网络给出位置?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36489583/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com