- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我从事机器学习工作已有几个月了。我已经使用了 caffe 和 darknet,现在将从 theano 开始。机器学习有 2 个主要任务:1. 检测和 2. 分类。尽管我了解大多数分类网络的制作或设计方式,但我无法清楚地了解构建神经网络来检测图像所涉及的基本步骤。在分类中,我们使用适当的最大池化、relu 和卷积层来获得更好的结果并微调网络。在制作用于对象检测的神经网络时需要牢记哪些重要事项?
最佳答案
一般来说,您所说的“检测”通常是通过回归任务来解决的(因此,“用于回归的神经网络”)。例如,您想要识别图片上的鼻尖(而不是其他)。您标记训练图像,以便您:
X(输入)- 只是尺寸的图像,例如 256x256 像素,灰度Y(输出)- 一对数字,显示该图像上鼻尖位置的 X、Y 坐标。
然后您构建了一个 DNN 来解决该问题的回归任务。该神经网络应用与分类相同的原则。你可以使用任何你想要的最大池化层、卷积层、ReLU。您只需要记住,您的输出层应该能够输出所需范围内的数字,仅此而已。
关于使用 ANN 解决此任务的好教程是 here
附注您想要检测对象所在的区域(例如将其放在图像中的彩色框中)?没问题,一种解决方案是多次解决回归任务,以定位对象的左上角、右上角、左下角、右下角。或者如果您愿意,可以使用滑动窗口。
关于machine-learning - 构建用于目标检测的神经网络最重要的步骤是什么? (不分类),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38201259/
Haskell 是一种具有许多 Root 于形式数学的特征的语言。我应该学习哪些数学主题才能更深入地了解和理解这门语言?例如,我认为抽象代数和范畴论都是值得探索的好话题。 最佳答案 一般来说,离散数学
大多数创建位图上下文的代码使用 kCGImageAlphaPremultipliedFirst 来创建 ARGB,而不是使用 kCGImageAlphaPremultipliedLast 来创建 RG
我是一名优秀的程序员,十分优秀!