machine-learning - 构建用于目标检测的神经网络最重要的步骤是什么？ (不分类)-6ren

machine-learning - 构建用于目标检测的神经网络最重要的步骤是什么？ (不分类)

转载作者：行者123 更新时间：2023-11-30 08:46:51

25

4

我从事机器学习工作已有几个月了。我已经使用了 caffe 和 darknet，现在将从 theano 开始。机器学习有 2 个主要任务:1. 检测和 2. 分类。尽管我了解大多数分类网络的制作或设计方式，但我无法清楚地了解构建神经网络来检测图像所涉及的基本步骤。在分类中，我们使用适当的最大池化、relu 和卷积层来获得更好的结果并微调网络。在制作用于对象检测的神经网络时需要牢记哪些重要事项？

最佳答案

一般来说，您所说的“检测”通常是通过回归任务来解决的(因此，“用于回归的神经网络”)。例如，您想要识别图片上的鼻尖(而不是其他)。您标记训练图像，以便您:

X(输入)- 只是尺寸的图像，例如 256x256 像素，灰度Y(输出)- 一对数字，显示该图像上鼻尖位置的 X、Y 坐标。

然后您构建了一个 DNN 来解决该问题的回归任务。该神经网络应用与分类相同的原则。你可以使用任何你想要的最大池化层、卷积层、ReLU。您只需要记住，您的输出层应该能够输出所需范围内的数字，仅此而已。

关于使用 ANN 解决此任务的好教程是 here

附注您想要检测对象所在的区域(例如将其放在图像中的彩色框中)？没问题，一种解决方案是多次解决回归任务，以定位对象的左上角、右上角、左下角、右下角。或者如果您愿意，可以使用滑动窗口。

关于machine-learning - 构建用于目标检测的神经网络最重要的步骤是什么？ (不分类)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38201259/

25

4

0

文章推荐： java - JConsole 中的内存泄漏是什么样的？

文章推荐：基于其他矩阵的矩阵元素预测

math - 哪些数学主题对于深入理解 Haskell 最重要？
Haskell 是一种具有许多 Root 于形式数学的特征的语言。我应该学习哪些数学主题才能更深入地了解和理解这门语言？例如，我认为抽象代数和范畴论都是值得探索的好话题。最佳答案一般来说，离散数学
iphone - 在 Core Graphics 中，为什么 Alpha channel 最重要？ (kCGImageAlphaPremultipliedFirst 与 kCGImageAlphaPremultipliedLast)
大多数创建位图上下文的代码使用 kCGImageAlphaPremultipliedFirst 来创建 ARGB，而不是使用 kCGImageAlphaPremultipliedLast 来创建 RG

首页

博学

6Ren·AI

商城

machine-learning - 构建用于目标检测的神经网络最重要的步骤是什么？ (不分类)