- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在做一个关于多类语义分割的项目。我制定了一个模型,该模型通过降低损失值来输出漂亮的下降分割图像。但是,我无法在诸如 meanIoU 或 Dice 系数之类的指标中评估模型性能。在二元语义分割的情况下,很容易将阈值设置为 0.5,将输出分类为对象或背景,但在多类语义分割的情况下不起作用。您能否告诉我如何在上述指标上获得模型性能?任何帮助将不胜感激!
顺便说一句,我正在使用 PyTorch 框架和 CamVid 数据集。
最佳答案
如果有人对此答案感兴趣,请同时查看 this issue .该问题的作者指出,mIoU 可以以不同的方式计算(并且该方法在文献中更被接受)。因此,在将实现用于任何正式发布之前,请考虑这一点。
基本上,issue-poster 建议的另一种方法是分别累积整个数据集上的交集和并集,并在最后一步进行划分。以下原始答案中的方法计算一批图像的交集和并集,然后将它们除以得到当前批处理的 IoU,然后对整个数据集的 IoU 取平均值。 p>
然而,这个下面给出的原始方法是有问题的,因为最终的平均 IoU 会随着批量大小而变化。另一方面,mIoU 不会随着 the issue 中提到的方法的批量大小而变化。因为单独的累积将确保批处理大小无关紧要(尽管更高的批处理大小肯定有助于加快评估速度)。
原答案:
下面给出的是 PyTorch 中平均 IoU(联合交集)的实现。
def mIOU(label, pred, num_classes=19):
pred = F.softmax(pred, dim=1)
pred = torch.argmax(pred, dim=1).squeeze(1)
iou_list = list()
present_iou_list = list()
pred = pred.view(-1)
label = label.view(-1)
# Note: Following for loop goes from 0 to (num_classes-1)
# and ignore_index is num_classes, thus ignore_index is
# not considered in computation of IoU.
for sem_class in range(num_classes):
pred_inds = (pred == sem_class)
target_inds = (label == sem_class)
if target_inds.long().sum().item() == 0:
iou_now = float('nan')
else:
intersection_now = (pred_inds[target_inds]).long().sum().item()
union_now = pred_inds.long().sum().item() + target_inds.long().sum().item() - intersection_now
iou_now = float(intersection_now) / float(union_now)
present_iou_list.append(iou_now)
iou_list.append(iou_now)
return np.mean(present_iou_list)
您的模型的预测将采用 one-hot 形式,因此首先采用 softmax(如果您的模型还没有),然后是 argmax
以获得每个像素处概率最高的索引。然后,我们计算每个类的 IoU(并在最后取平均值)。
我们可以将预测和标签 reshape 为一维向量(我读到它使计算更快)。对于每个类,我们首先使用 pred_inds = (pred == sem_class)
和 target_inds = (label == sem_class)
识别该类的索引。生成的 pred_inds
和 target_inds
将在标记为该特定类的像素处具有 1,而对于任何其他类,将具有 0。
那么,目标可能根本不包含该特定类。这将使该类的 IoU 计算无效,因为它不存在于目标中。因此,您为此类类分配了一个 NaN IoU(以便您稍后可以识别它们),并且不让它们参与均值的计算。
如果特定类存在于目标中,则 pred_inds[target_inds]
将给出一个 1 和 0 的向量,其中 1 的索引是预测和目标相等的那些,否则为零。取所有元素的总和将得到交集。
如果我们添加 pred_inds
和 target_inds
的所有元素,我们将得到该特定类的像素的并集 + 交集。所以,我们减去已经计算的交集得到并集。然后,我们可以划分交集和并集,得到该特定类的 IoU,并将其添加到有效 IoU 列表中。
最后,你取整个列表的平均值来获得 mIoU。如果你想要骰子系数,你可以用类似的方式计算它。
关于python-3.x - 多类语义分割模型评估,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62461379/
我正在尝试提升我的 javascript 编程技能(或者说我的编程技能时期 :)) 所以我试图理解一些语义: 第一行的“?”是什么意思?均值和“-distance”中的减号 第二行中的“+=”或“-=
我正在尝试在语义 UI 中执行复选框,但它不起作用,我无法弄清楚我做错了什么。 我包括jquery、semantic.min.js、checkbox.js 和semantic.min.css,然后我添
我正在构建一个 Spring 后端。我有一个 Controller ,它获取一个“搜索对象” - 一个具有 10 个字段的对象,其中只有一个应该被填充,所以搜索功能(我没有编写,但需要对其进行更改和重
我面临着编写更智能/高级的“相关内容”算法的挑战,并且不知道从哪里开始,所以我决定提出一个问题,是否有人会指出我正确的方向。 我们的数据库包含很多文章,到目前为止,我们使用关键字/标签查询了相关文章,
我正在尝试将通用字符串写入Rust中的数字函数,其中支持的类型为i16,i32,i64,u32,u64,f32和f64。 最初我有这个: fn str_to_num(s: &str, default_
假设我们在 hpp 文件中有一个带有唯一指针的简单结构: struct SomeType { SomeType() = default; ~SomeType(); st
这是同一预处理指令的多个问题。 1 - <> 还是 ""? 除了在 MSDN 中找到的信息: #include Directive (C-C++) 1.a:这两种符号有什么区别? 1.b:所有编译器都
所以基本上我有一个带有列表的简单系统,当我选择一个项目时,它会显示描述和绑定(bind)到该项目的图像。 项目:https://jsfiddle.net/jhnjcddh/2/ 问题是我需要在 JS
很抱歉问了一个愚蠢的问题,但有人能告诉我以下是什么意思吗 for ctype, (codename, name) in searched_perms: 我不明白括号里是怎么回事。 for ctype
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: Why do all these crazy function pointer definitions al
我正在学习 HTML5,并获得了一个将 CSS Zen Gardens 转换为 HTML5 语义版本的项目。我已经能够轻松地转换其中的大部分内容,但是底部的链接/导航给我带来了一些问题。 转换此/处理
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题? 更新问题,以便 editing this post 可以用事实和引用来回答它. 关闭 9 年前。 Improv
我一直在我的 emacs c/c++ 开发设置中试验 cedet 和语义,除了一个小细节外,我对它非常满意。 我使用 ede-cpp-root-project 创建一个项目,并给出我的项目的根目录以及
引用问题自http://www.garfieldtech.com/blog/put-up-with-put (这是针对 Drupal 开源项目的,有点元,因为这里没有代码): GET、HEAD 和 P
我有以下代码。 let v_blue = UIView() v_blue.backgroundColor = UIColor.blueColor() l
我目前正在 objc.io 上阅读优秀的 Advanced Swift 书籍,但遇到了一些我不明白的问题。 如果您在操场上运行以下代码,您会注意到在修改字典中包含的结构时,下标访问会生成一个副本,但随
谁能给我一个关于 Flutter 上下文中语义概念的清晰解释(或链接)(它实际上是什么,何时使用,更新...)? 我在谷歌上搜索了很多,但到目前为止还没有找到任何好的解释。 非常感谢, 最佳答案 Di
这是我的代码 Was this what you wanted? It's good to see you again.
我有一个侧边栏,其中包含应用程序的主导航。它还包含一个 button 触发侧边栏的打开/关闭。在语义方面,标记应该是什么样的? 我应该把侧边栏放在一边,然后只在周围设置导航吗主导航,不包括打开/关闭触
考虑下面这行 Lisp 代码: (some-function 7 8 | 9) ;; some comment. note the extra indentation 该点位于“8”和
我是一名优秀的程序员,十分优秀!