- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我了解 CNN 如何解决分类问题,例如在 MNIST 数据集上,其中每个图像代表一个手写数字。对图像进行评估,并以一定的置信度给出分类。
我想知道如果我希望识别一张图像中的多个对象,并且对每个对象都有信心,我应该采取什么方法。例如 - 如果我评估猫和狗的图像,我希望“猫”和“狗”都有很高的置信度。我不在乎物体在图片中的位置。
我目前的知识将引导我构建一个仅包含狗的图像数据集和一个仅包含猫的图像数据集。我会重新培训顶层,例如 Inception V3网络,它将能够识别哪些图像是猫,哪些图像是狗。
这样做的问题是,评估狗和猫的图像将导致 50% 的狗和 50% 的猫 - 因为它试图对图像进行分类,但我想“标记”图像(理想情况下达到~100% 狗,~100% 猫)。
我简要地研究了基于区域的 CNN,它解决了类似的问题,但我不关心对象在图片中的位置 - 只是它们都可以被识别。
有哪些方法可以解决这个问题?我想在 Python 中使用 Tensorflow 或 Keras 之类的东西来实现这一点。
最佳答案
我知道这是一个老问题,但如果它出现在其他人的任何 Google 搜索的首页中(就像对我一样),我想我可以补充一些有用的东西。
InceptionV3 的最后一层是 Softmax 函数,它试图表示这是标签 A 或标签 B。
但是,如果您想修改诸如 Inception 之类的内容以进行多标签分类,则不要将 Softmax 用于最后一层,而是将其替换为 Sigmoid 之类的内容,以便每个标签都根据其自身的优点进行衡量(并且不与它的邻居进行比较)。
有关其背后原因的更多信息(以及有关如何修改 retrain.py
的完整说明)可以在此处找到:
https://towardsdatascience.com/multi-label-image-classification-with-inception-net-cbb2ee538e30
The add_final_training_ops() method originally added a new softmax and fully-connected layer for training. We just need to replace the softmax function with a different one.
Why?
The softmax function squashes all values of a vector into a range of [0,1] summing together to 1. Which is exactly what we want in a single-label classification. But for our multi-label case, we would like our resulting class probabilities to be able to express that an image of a car belongs to class car with 90% probability and to class accident with 30% probability etc. We will achieve that by using for example sigmoid function. Specifically we will replace:
final_tensor = tf.nn.softmax(logits, name=final_tensor_name)
with:
final_tensor = tf.nn.sigmoid(logits, name=final_tensor_name)
We also have to update the way cross entropy is calculated to properly train our network:
Again, simply replace softmax with sigmoid:
cross_entropy = tf.nn.sigmoid_cross_entropy_with_logits(logits,ground_truth_input)
关于image-processing - 神经网络 - 自信地检测一张图像中的多个对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47026383/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 5年前关闭。 Improve t
我是一名设计老师,试图帮助学生应对编程挑战,所以我编码是为了好玩,但我不是专家。 她需要找到 mode (最常见的值)在使用耦合到 Arduino 的传感器的数据构建的数据集中,然后根据结果激活一些功
我正在开发一个应用程序,该应用程序提供 CPU 使用率最高的 5 个应用程序名称。目前,我通过以下代码获得了排名前 5 的应用程序: var _ = require('lodash');
互联网上很少有例子涉及这个问题的所有三个问题——即 set-process-sentinel ; set-process-filter ;和 start-process . 我尝试了几种不同的方法来微
如 this post 中所述,在 C# 中有两种调用另一个进程的方法。 Process.Start("hello"); 和 Process p = new Process(); p.StartInf
我试图让我的桨从白色变为渐变(线性),并使球具有径向渐变。感谢您的帮助!您可以在 void drawPaddle 中找到桨的代码。 这是我的目标: 这是我的代码: //球 int ballX = 50
考虑:流程(a)根据我的文字: A process is first entered at the time of simulation, at which time it is executed u
我真的希望 Processing 有用于处理数组的 push 和 pop 方法,但由于它没有,我不得不试图找出删除数组中特定位置的对象的最佳方法。我相信这对很多人来说都是基本的,但我可以使用一些帮助,
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 10 年前。 Improve thi
以编程方式,我如何确定 Windows 10 中的 3 个类别 应用 后台进程 Windows 服务 就像任务管理器一样? 即我需要一些 C# 代码,我可以确定应用程序列表与后台进程列表。检查 Win
当我导入 node:process它工作正常。但是,当我尝试要求相同时,它会出错。 这工作正常: import process from 'node:process'; 但是当我尝试要求相同时,它会引
我正在上一门使用处理的类(class)。 我在理解 map() 函数时遇到问题。 根据它的文档( http://www.processing.org/reference/map_.html ): Re
我试图执行: composer.phar update 并收到: Fatal error: Allowed memory size of 94371840 bytes exhausted (tried
给定一堆二维图像,如何使用 Processing/Processing.js 产生体积渲染效果? 目前我的想法是使用 java(类似于 imageJ)进行体积渲染 -> 获取体积渲染图像的面作为单独的
这是代码示例 var startInfo = new ProcessStartInfo { Arguments = commandStr, FileName = @"C:\Window
当我在 Processing(草图 > 导入库 > 添加库)中添加库时,它安装在哪里? 最佳答案 它们安装在您的 中速写本位置 . 您可以通过转到"file">“首选项”来查看和更改您的速写本位置。草
无聊的好奇... 我正在查看当前进程的一些属性: using(Process p = Process.GetCurrentProcess()) { // Inspect properties
我正在尝试在同一页面上运行多个草图。 初始化脚本指定: /* * This code searches for all the * in your page and loads each scrip
Process.Kill 后是否需要使用 Process.WaitForExit? 如果调用进程在调用 Process.Kill 后立即退出怎么办? 这会导致 Process.Kill 失败吗? 编辑
我尝试使用处理从麦克风获取频率。我混合了文档中的两个示例,但“最高”并不是真正的赫兹(a 是 440 赫兹)。 你知道如何拥有比这更好的东西吗? import ddf.minim.*; import
我是一名优秀的程序员,十分优秀!