machine-learning - Caffe : train network accuracy = 1 constant ! 准确性问题-6ren

machine-learning - Caffe : train network accuracy = 1 constant ! 准确性问题

转载作者：行者123 更新时间：2023-11-30 08:50:55

24

4

现在，我正在使用 2 类数据训练网络...但第一次迭代后精度为常数 1!

输入数据是灰度图像。创建 HDF5Data 时，这两个类图像都是随机选择的。

为什么会这样？哪里出了问题或者哪里出错了!

网络.prototxt:

name: "brainMRI"
layer {
  name: "data"
  type: "HDF5Data"
  top: "data"
  top: "label"
  include: {
    phase: TRAIN
  }
  hdf5_data_param {
    source: "/home/shivangpatel/caffe/brainMRI1/train_file_location.txt"
    batch_size: 10
  }
}
layer {
  name: "data"
  type: "HDF5Data"
  top: "data"
  top: "label"
  include: {
    phase: TEST
  }
  hdf5_data_param {
    source: "/home/shivangpatel/caffe/brainMRI1/test_file_location.txt"
    batch_size: 10
  }
}

layer {
  name: "conv1"
  type: "Convolution"
  bottom: "data"
  top: "conv1"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 20
    kernel_size: 5
    stride: 1
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "pool1"
  type: "Pooling"
  bottom: "conv1"
  top: "pool1"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "conv2"
  type: "Convolution"
  bottom: "pool1"
  top: "conv2"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 50
    kernel_size: 5
    stride: 1
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "pool2"
  type: "Pooling"
  bottom: "conv2"
  top: "pool2"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "ip1"
  type: "InnerProduct"
  bottom: "pool2"
  top: "ip1"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 500
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "relu1"
  type: "ReLU"
  bottom: "ip1"
  top: "ip1"
}
layer {
  name: "ip2"
  type: "InnerProduct"
  bottom: "ip1"
  top: "ip2"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 2
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "softmax"
  type: "Softmax"
  bottom: "ip2"
  top: "smip2"
}

layer {
  name: "loss"
  type: "SoftmaxWithLoss"
  bottom: "ip2"
  bottom: "label"
  top: "loss"
}

layer {
  name: "accuracy"
  type: "Accuracy"
  bottom: "smip2"
  bottom: "label"
  top: "accuracy"
  include {
    phase: TEST
  }
}

输出:

I0217 17:41:07.912580  2913 net.cpp:270] This network produces output loss
I0217 17:41:07.912607  2913 net.cpp:283] Network initialization done.
I0217 17:41:07.912739  2913 solver.cpp:60] Solver scaffolding done.
I0217 17:41:07.912789  2913 caffe.cpp:212] Starting Optimization
I0217 17:41:07.912813  2913 solver.cpp:288] Solving brainMRI
I0217 17:41:07.912832  2913 solver.cpp:289] Learning Rate Policy: inv
I0217 17:41:07.920737  2913 solver.cpp:341] Iteration 0, Testing net (#0)
I0217 17:41:08.235076  2913 solver.cpp:409]     Test net output #0: accuracy = 0.98
I0217 17:41:08.235194  2913 solver.cpp:409]     Test net output #1: loss = 0.0560832 (* 1 = 0.0560832 loss)
I0217 17:41:35.831647  2913 solver.cpp:341] Iteration 100, Testing net (#0)
I0217 17:41:36.140849  2913 solver.cpp:409]     Test net output #0: accuracy = 1
I0217 17:41:36.140949  2913 solver.cpp:409]     Test net output #1: loss = 0.00757247 (* 1 = 0.00757247 loss)
I0217 17:42:05.465395  2913 solver.cpp:341] Iteration 200, Testing net (#0)
I0217 17:42:05.775877  2913 solver.cpp:409]     Test net output #0: accuracy = 1
I0217 17:42:05.776000  2913 solver.cpp:409]     Test net output #1: loss = 0.0144996 (* 1 = 0.0144996 loss)
.............
.............

最佳答案

从评论中总结一些信息:
- 您以 test_interval:100 迭代的间隔运行测试。
- 每个测试间隔超过 test_iter:5 * batch_size:10 = 50 个样本。
- 你的训练集和测试集似乎非常精确:所有负样本(标签=0)都在所有正样本之前分组在一起。

<小时/>

考虑您的 SGD 迭代求解器，您在训练期间向其提供批处理 batch_size:10。您的训练集在任何正样本之前有 14,746 个负样本(即 1474 个批处理)。因此，对于前 1474 次迭代，您的求解器仅“看到”负面示例，而看不到正面示例。
您预计该求解器会学到什么？

问题

你的求解器只看到反例，因此知道无论输入是什么，它都应该输出“0”。您的测试集也以相同的方式排序，因此在每个 test_interval 只测试 50 个样本，您只测试测试集中的负面示例，从而获得完美的准确度 1。
但正如您所指出的，您的网络实际上什么也没学到。

解决方案

我想您现在已经猜到解决方案应该是什么了。您需要打乱训练集，并在整个测试集上测试您的网络。

关于machine-learning - Caffe : train network accuracy = 1 constant ! 准确性问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35456689/

24

4

0

文章推荐： matlab - 在 matlab 中创建径向基函数核矩阵

c++ - 我们在哪里以及为什么使用 "pointers that point to constants"、 "constant pointers"和 "constant pointers that point to constants"？
所以如果我在 C++ 中有这样的东西: char A_char = 'A'; char * myPtr = &A_char; const char * myPtr = &char_A; //point
perl - -CONSTANT 的歧义使用解析为 -&CONSTANT()
我试图在我的 Perl 脚本中将魔数(Magic Number)声明为常量，如 perlsub 中所述。但是，我收到警告: $ cat foo.perl use warnings ; use stri
haskell - 如何为 Constant a b = Constant a 实现可折叠实例？
我想为 data Constant a b = Constant a 这是我的直接尝试: instance Foldable (Constant a) where foldr f b (Const
javascript - ./~/constants-browserify/constants.json 中的错误
我在客户端和服务器端拆分了我的文件夹，但我没有从父文件夹工作，我表现得好像它们是 2 个不同的文件夹...现在我想部署到 Heroku 但我为此需要一个主文件夹，所以我想更改我的 webpack.co
c++ - 良好做法 : Constant to non-constant cast
当函数不修改对象参数时，我总是让它请求一个常量引用，即使引用的对象不是真正的常量。这是错误的吗？对于包装类，我想这样写: template class Wrapper{ private: B*
c++ - `core constant expression` 与 `constant expression`
核心常量表达式的定义取决于常量表达式的概念，如要点 (2.7.1) 和 (2.9.1) 所示N4140 的。 §5.19/2: A conditional-expression e is a core
javascript - variable === constant 和 constant === variable 有什么区别
我有以下代码片段，它按预期工作。其中 x 是一个变量 var myVariable = (x === 'A' || x=== 'B') ? 'sui' : 'pai'; 但是闭包编译器正在将它转换为
java - 国际化 : Constants needed in constant (Java/GWT)
我是一个国际化应用程序。其中一部分在于菜单的国际化。没关系。通过 GWT，我可以使用 Constants 接口(interface)。现在我必须国际化该应用程序的帮助，其中包括一些涉及菜单的文本。
c++ - 什么是 "symbolic constants"和 "magic constants"？
在 Bjarne Stroustrup 的 A Tour of C++ 中，每章末尾都列出了一些建议。在第一章的结尾，其中一个写道: Avoid ‘‘magic constants;’’ use sy
c++ - C/C++ : Constant array of constant arrays
创建常量数组的常量数组的语法是什么？我希望函数参数是常量 char* 字符串的常量数组。最佳答案您可以通过将 const 放在第一个星号的右侧来实现，例如 void f(const char *
ruby - Chefspec 重复加载库并发出警告 "already initialized constant CONSTANT"
我有一本带图书馆的 Chef Recipe ，例如库.rb。它包含一个 CONSTANT: CONSTANT = 'constant' 当我为这本 Recipe 编写单元测试时，它总是给我警告: (S
c++ - 为什么 if( constant == variable ) 比 if ( variable == constant ) 更受欢迎
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: How to check for equals? (0 == i) or (i == 0) Why does
c++ - "function call must have a constant value in a constant expression"
我有以下代码: constexpr unsigned long long power_function(const unsigned long long prime, const unsigned l
javascript - AngularJS module.constant() : how to define a constant inside a module only?
在一个页面上，我有几个 Angular 模块。我为每个模块定义了一个包含模块版本的常量。 var module1 = angular.module('module1').constant('versi
c++ - 为什么我们需要两个定义: integral constant expression and converted constant expression?
C++14 中的§5.19/3 定义了一个整型常量表达式和一个转换后的常量表达式: An integral constant expression is an expression of integr
c# - R# 设置中 'Local constants' 和 'Constant fields' 之间的差异？
如果您打开 R# 选项并转到代码编辑> C# > 命名样式，则有 2 个设置与我非常相似。本地常量和常量字段(私有(private))。一种是 lowerCaseCamel，另一种是 UpperCam
java - 将 `enum constant name` 变回 `enum constant` 的通用方法
如何将恰好命名为 reverse 的以下方法重写为允许任何枚举类型的泛型方法。 public class TestX { enum Gender { male, female } pu
java - CONSTANT.equals(VARIABLE) 是否比 VARIABLE.equals(CONSTANT) 快？
我和我的一位队友进行了一次有趣的谈话。 CONSTANT.equals(VARIABLE) 是否比 Java 中的 VARIABLE.equals(CONSTANT) 快？我怀疑这是一个虚假陈述。但
c - which function takes no constant parameters similar to system(constant char) in linux
我想在 c 程序中执行脚本 cmd，所以函数 SYSTEM(CONST CHAR) 可以执行它，但我想使用这个函数和 3 个不同的参数写入一次。谁能帮帮我，有没有那种功能。最佳答案如果我猜对了，您
typescript - "Variable ' X ' can be made constant", 'constant' 是什么意思？
VStudio 或 ReSharper 给我以下建议: constant 在这种情况下意味着什么？如果它是当前方法作用域中的一个常量，目的是什么？方法往往很小，因此与常规 var 相比，它不应该有任何

首页

博学

6Ren·AI

商城

machine-learning - Caffe : train network accuracy = 1 constant ! 准确性问题

问题

解决方案