gpt4 book ai didi

deep-learning - CNN 注意力/激活图

转载 作者:行者123 更新时间:2023-12-03 16:52:45 32 4
gpt4 key购买 nike

查找图像的哪些部分对图像分类贡献最大的常用技术有哪些通过卷积神经网络 ?

一般来说,假设我们有 0 到 1 之间的浮点值作为整体的二维矩阵。每个矩阵都与一个标签(单标签、多类)相关联,目标是通过(Keras)2D CNN 进行分类。

我正在尝试寻找方法来提取对分类贡献最大的行/列的相关子序列。

两个例子:

https://github.com/jacobgil/keras-cam

https://github.com/tdeboissiere/VGG16CAM-keras

其他着眼于 Keras 的示例/资源将不胜感激。

请注意,我的数据集不是实际图像,因此在这种情况下使用 ImageDataGenerator 的方法可能不直接适用。

最佳答案

有很多可视化方法。这些方法中的每一种都有其优点和缺点。

但是,您必须记住,这些方法部分地可视化了不同的事物。这是基于此 paper 的简短概述.
您可以区分三个主要的可视化组:

  • 函数 (梯度,显着图):这些方法可视化输入空间的变化如何影响预测
  • 信号 (反卷积、Guided BackProp、PatternNet):信号(神经元激活的原因)被可视化。因此,这可视化了导致特定神经元激活的模式。
  • 归属 (LRP、Deep Taylor Decomposition、PatternAttribution):这些方法可视化单个像素对预测的贡献程度。因此,您会得到一个热图,突出显示输入图像的哪些像素对分类的贡献最大。

  • 由于您要问的是一个像素对分类的贡献有多大,您应该使用归因方法。尽管如此,其他方法也有其存在的权利。

    用于可视化热图的一个不错的工具箱是 iNNvestigate .
    此工具箱包含以下方法:
  • SmoothGrad
  • DeConvNet
  • Guided BackProp
  • PatternNet
  • PatternAttribution
  • 遮挡
  • Input times Gradient
  • Integrated Gradients
  • Deep Taylor
  • LRP
  • DeepLift
  • 关于deep-learning - CNN 注意力/激活图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44731990/

    32 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com