- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在 Andrew Ng 的深度学习类(class)中看到了一种定位图像上单个对象的方法:https://www.youtube.com/watch?v=GSwYGkTfOKk 。据我了解,例如,您可以将一个点绑定(bind)到对象的特定部分,将坐标:x、y 作为标签 y 并训练 CNN。
我想训练一个 CNN 神经网络来定位我的眼睛(而不是分类)。我给自己拍了 200 张照片:60x60 像素的灰度照片。我标记了左眼和右眼,标记的眼睛的每个坐标都标准化为0-1。 y 标签为:[eye1 的 x,eye1 的 y,eye2 的 x,eye2 的 y]。我在输出层 sigmoid 函数中使用了具有 mse 损失的 SGD optimazer。
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Conv2D(64, (3,3), input_shape= (60,60, 1)))
model.add(tf.keras.layers.Activation('relu'))
model.add(tf.keras.layers.MaxPool2D(pool_size=(2,2)))
model.add(tf.keras.layers.Conv2D(32, (3,3)))
model.add(tf.keras.layers.Activation('relu'))
model.add(tf.keras.layers.MaxPool2D(pool_size=(2,2)))
model.add(tf.keras.layers.Flatten())
model.add(tf.keras.layers.Dense(64, activation='relu'))
model.add(tf.keras.layers.Dense(4, activation='sigmoid'))
sgd= tf.keras.optimizers.SGD(lr = 0.01)
model.compile(loss = 'mean_squared_error', optimizer=sgd, metrics=['accuracy'])
model.fit(x,y, batch_size=3, epochs=15, validation_split=0.2)
这个任务不起作用,那么解决这个问题的方法是什么?我在某处看到:将 CNN 应用于图像(我想没有密集层),然后在来自 CNN 的展平数据上对每个 x/y 坐标使用线性回归(多变量逻辑回归)。这是一个解决方案吗?据我了解,我会将每个图像输入 Conv 和 MaxPool 层,然后压平,然后将数据输入 lin。回归并训练它,但我不知道如何在 keras 中执行此操作。我是这个领域的新手,所以任何想法对我都有帮助。
最佳答案
首先,对您的代码进行一些观察。
由于最后一层包含超过 2 个神经元,因此您必须使用的激活函数是 softmax ,不是 sigmoid (请注意,这是分类的情况,而不是回归的情况)。
您应该只在进行二元分类时使用 sigmoid,但当您有两个以上的类时则不应使用(请注意,您也可以对 2 个类使用 softmax,但从计算开销较小的角度来看,不一定建议这样做)。
您的问题既是一个回归问题,又是一个分类问题!。
卷积神经网络的第一层包含 64 个特征图,每个内核的大小为 3x3。尽管将图像输入神经网络的方式是正确的,但您仅输入灰度图像,而不是 x1,x2,y1,y2 坐标。
对于具有回归功能的 ANN,请查看本教程:https://machinelearningmastery.com/regression-tutorial-keras-deep-learning-library-python/ .
你的直觉是正确的;对象检测神经网络用卷积层取代全连接层。 Yann LeCun 甚至指出全连接层不应该成为 CNN 的一部分。
由于您是该领域的新手,我建议采用以下管道。
1) 找到一个用您首选的深度学习库(Keras/PyTorch/TensorFlow 等)编写的在线 github 模型。
2) 按照说明/教程重现 github 用户获得的结果。
3)通过后者,您还应该理解代码/获得良好的直观掌握。
4)使模型适应您需要的问题。
您可以从这里开始(这是对象检测 - 检测多个对象以及不同类别的对象):https://github.com/pierluigiferrari/ssd_keras .
如果您还有其他问题,请写下来,我很乐意为您提供帮助!
关于python - 用于目标定位的卷积神经网络,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54025916/
我必须从我的网站中删除()一些iem,然后将它们追加()回来,但是当我追加它们时,它们出现在不同的地方,而我希望它们完全显示在它们以前的同一个地方是。 有什么解决办法吗? 这是一个沙箱,请随意更新(注
一个。图片 (960x7)b. div(宽度:960,填充:10) 我想定位 (a),使其距顶部 50 像素,居中。我想将 (b) 放置在 (a) 的正下方,没有空格。 我的 CSS 如下: @cha
放置某物的正确方法是什么?我有一个在中心显示博客文章的 div。 "" rel="bookmark"> BY LOUIS MOORE ON " pubdate>
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭1
我已经成功地使用了 position:fixed 设置 CSS/CSS3 并且工作得很好! 我几天前看到了这个,想知道他们是如何实现向下滚动时发生的效果的,菜单栏在滚动前处于一个位置,然后转到顶部并自
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 7 年前。 Improv
接口定义 能够对于文字、段落乃至任何元素的精准定位 并做出增删改查,都是在开发一款富文本编辑器时一项最基本也是最重要的功能之一。让我们先来看看Slate中对于如何在文档树中定位元素是怎么定义的
例如,使用 WPF 在选项卡控件的最左上角定位三个 tabitem 和在最右上角定位一个 tabitem 的正确方法是什么? 我尝试通过更改边距将第四个 tabitem 向右移动,但这并没有产生好的结
我正在尝试使用 Javascript 创建一个跟随鼠标在页面上移动的东西。我希望它是米老鼠,我希望他的眼睛跟随鼠标移动他的眼球...这是我到目前为止的代码(从网络上的各个地方收集,因此归功于编写该部分
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 9 年前。 Improve
我试图将两个按钮放置在左上角。但它们始终位于顶部中心。 我已经尝试过这个: jp = new JPanel(); jp.setLayout(new GridBagLayout()); GridBagC
我在使用 JQuery 向下滑动功能时遇到问题。我可以让它正常工作,但是我向下滑动的元素的位置会根据视口(viewport)的大小而变化。我想做的是将它与它滑动的元素联系起来。 This JSfidd
我正在尝试创建一个棋盘,并将其放置在屏幕中间,但到目前为止我无法将它直接放在中间。我不想将位置硬编码到屏幕上,因为我要处理不同的屏幕尺寸。 var winsize = cc.director.
我正在尝试从 mysql 中的 2 个字符串点之间提取数据,我的示例脚本是 'otherdata&p1=textneeded&otherdata' 我需要拉出“textneeded”位,“P1=”是起
如何在 JavaFX 中设置按钮的位置?我的代码: bZero = new Button(); bZero.setPrefSize(45, 20); mainPane.getChildren().ad
我有一个 iPhone 应用程序,我可以在其中显示一系列图像。当用户点击图像时,我需要将该图像带到第一个位置,表明它是所选图像。我可以通过子类化实现 uiscrollview 中的点击。但是我无法将
在下图中,它显示了一个image、textbox 和一个css menu image 我的 CSS 菜单非常完美。我终于按照我需要的方式得到了它。我的问题是我需要导航栏中央的文本框,然后我需要我的图像
我必须创建一个看起来像这样的 div id为2的div应该出现在图片的右下角,图片的大小不固定id=2的div应该应用什么css id =1 的 div 没有定义位置,所以使用默认值,图像也是
如何将我的文本和图像对齐在同一行? 每当我使用 padding 或 margins 时,它就会崩溃到我正在使用的圆形图像中。 #alignPhoto { padding-right: 50px;
简单的问题,如何定位具有整个页面引用的元素? 在我的例子中,我在标题中得到了一个 float 图像,然后是 2 组标题。当我使用时: text-align: center; 它使用图像宽度端和页面其余
我是一名优秀的程序员,十分优秀!