gpt4 book ai didi

machine-learning - 构建用于目标检测的神经网络最重要的步骤是什么? (不分类)

转载 作者:行者123 更新时间:2023-11-30 08:46:51 25 4
gpt4 key购买 nike

我从事机器学习工作已有几个月了。我已经使用了 caffe 和 darknet,现在将从 theano 开始。机器学习有 2 个主要任务:1. 检测和 2. 分类。尽管我了解大多数分类网络的制作或设计方式,但我无法清楚地了解构建神经网络来检测图像所涉及的基本步骤。在分类中,我们使用适当的最大池化、relu 和卷积层来获得更好的结果并微调网络。在制作用于对象检测的神经网络时需要牢记哪些重要事项?

最佳答案

一般来说,您所说的“检测”通常是通过回归任务来解决的(因此,“用于回归的神经网络”)。例如,您想要识别图片上的鼻尖(而不是其他)。您标记训练图像,以便您:

X(输入)- 只是尺寸的图像,例如 256x256 像素,灰度Y(输出)- 一对数字,显示该图像上鼻尖位置的 X、Y 坐标。

然后您构建了一个 DNN 来解决该问题的回归任务。该神经网络应用与分类相同的原则。你可以使用任何你想要的最大池化层、卷积层、ReLU。您只需要记住,您的输出层应该能够输出所需范围内的数字,仅此而已。

关于使用 ANN 解决此任务的好教程是 here

附注您想要检测对象所在的区域(例如将其放在图像中的彩色框中)?没问题,一种解决方案是多次解决回归任务,以定位对象的左上角、右上角、左下角、右下角。或者如果您愿意,可以使用滑动窗口。

关于machine-learning - 构建用于目标检测的神经网络最重要的步骤是什么? (不分类),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38201259/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com