theano - Caffe 与 Theano MNIST 示例-6ren

theano - Caffe 与 Theano MNIST 示例

转载作者：行者123 更新时间：2023-12-02 08:22:42

25

4

我正在尝试学习(和比较)不同的深度学习框架，到时候它们是 Caffe 和 Theano。

http://caffe.berkeleyvision.org/gathered/examples/mnist.html

和

http://deeplearning.net/tutorial/lenet.html

我按照教程在 MNIST 数据集上运行这些框架。但是，我注意到在准确性和性能方面存在很大差异。

对于 Caffe，准确率可以非常快地提高到 ~97%。事实上，只需要 5 分钟就可以完成程序(使用 GPU)，最终在测试集上的准确率超过 99%。多么令人印象深刻!

然而，在 Theano 上，它要差得多。我花了 46 多分钟(使用相同的 GPU)，才达到 92% 的测试性能。

我很困惑，因为在同一数据集上运行相对相同架构的框架之间不应该有太大差异。

所以我的问题是。 Caffe 报告的准确率是测试集上正确预测的百分比吗？如果是这样，是否有任何差异的解释？

谢谢。

最佳答案

Theano 和 Caffe 的示例不是完全相同的网络。我能想到的两个主要区别是 Theano 示例使用 sigmoid/tanh 激活函数，而 Caffe 教程使用 ReLU激活函数，并且 Theano 代码使用正常的 minibatch gradient descent而 Caffe 使用 momentum optimiser .这两种差异都会显着影响网络的训练时间。使用 ReLU 单元也可能会影响准确性。

请注意，Caffe 是一个深度学习框架，它已经具有许多常用功能的现成功能，例如动量优化器。另一方面，Theano 是一个符号数学库，可用于构建神经网络。但是，它不是深度学习框架。

您提到的 Theano 教程是了解卷积网络和其他神经网络在基本层面上的工作原理的绝佳资源。然而，实现所有最先进的调整将很麻烦。如果您想快速获得最先进的结果，最好使用现有的深度学习框架之一。除了 Caffe，还有许多基于 Theano 的框架。我知道keras , blocks , pylearn2 , 和我个人的最爱 lasagne .

关于theano - Caffe 与 Theano MNIST 示例，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35426162/

25

4

0

文章推荐： JavaFX:使用 FXML 按行(在网格 Pane 中)组织控件

文章推荐： java - 删除 Jtable 中的行后出错

文章推荐：在不规则间隔内 reshape 和汇总数据

文章推荐： sql - DB2 将自动增量列添加到现有表

caffe - Caffe 何时制作数据副本？
// Assuming that data are on the CPU initially, and we have a blob. const Dtype* foo; Dtype* bar;
caffe - Caffe 上的多维标签数据
我计划使用 NYU depth v2 数据集实现一个 CNN，它可以从单个图像估计深度。通过本教程，我了解到在 Caffe 上实现处理分类问题的 CNN 很容易。我很好奇 Caffe 是否适合涉及多维
python - Caffe 特征提取太慢？ caffe.Classifier 或 caffe.Net
我用图像训练了一个模型。现在想将 fc-6 功能提取到 .npy 文件中。我正在使用 caffe.set_mode_gpu() 运行 caffe.Classifier 并提取特征。而不是每帧提取和保
python - 文件未找到错误: [Errno 2] No such file or directory: '/opt/caffe/build/tools/caffe' : '/opt/caffe/build/tools/caffe'
我通过 apt install 命令在我的 Ubuntu v18 VM 上安装了 caffe-cpu。我正在努力找出安装目录所在的位置，如果我错了请纠正我，但我相信没有安装目录。我尝试执行的 NN 模
caffe - 在 Caffe 中是否可以计算架构中发生的操作数量？
这个问题在这里已经有了答案: how to calculate a net's FLOPs in CNN [closed] (4 个回答) 4年前关闭。我在tensorflow tutorial看到
caffe - 在 Caffe 中提前停止
似乎this related PR现在已经死了，有没有解决方法可以使用 early stopping在咖啡厅？也许在 Caffe 之上使用 Python？最佳答案第一部分很容易手动完成:让我们监控
caffe - 进行运行测试时“数据库中已存在文件:caffe.proto”
当我尝试在MacbookPro（El Capitan）上安装最新的caffe时，出现以下错误。怎么了？如何解决？我在此网站上发现了一些类似的问题，不幸的是显示的修复似乎是ubuntu特有的。先感谢
caffe - Caffe 求解器中的 average_loss 字段是什么？
average_loss有什么用?有人可以举一个例子或用外行的术语解释吗？最佳答案您可以登录 caffe.proto文件。当前版本中的第 151 行对 average_loss 给出了以下注释:
caffe - 在 caffe 中融合不同的输入 channel ？
我想先分别处理不同类型的数据，然后将它们融合到一个公共(public)层中。这在 Caffe 中是否可行，如果可以，最好的方法是什么？我读过可以在同一个 prototxt 文件中定义多个数据层。但是
caffe - 如何在 Caffe 中合并多个不同形状的 Blob ？
我正在尝试将几个底部 Blob 合并为一个顶部 Blob ，然后将其馈送到下一层。这些 Blob 来自不同的卷积/FC层，因此它们的形状不同。我尝试了 concat 层，但使用轴 0 或 1 时，
caffe - Ubuntu 17.10 : Where is Caffe installed?
包 Digits 需要使用 Caffe 安装目录的位置设置环境变量。安装Caffe的简单方法是apt-get install caffe-cuda .但是，我无法弄清楚它的安装位置。没有安装在hom
caffe - 在 Caffe 中计算 ROC 和 AUC？
我在 Caffe 中训练过 imagenet。现在我正在尝试为我的模型和 caffe 提供的训练模型计算 ROC/AUC。我有两个问题: 1) ROC/AUC 主要用于二进制类，但我也发现在某些情况下
caffe - 将 Caffe train.txt 转换为 Tensorflow
我正在尝试使我的 Caffe 代码适应 tensorflow。我想知道将我的 train.txt 和 test.txt 转换为适用于 tensorflow 的最佳方法是什么。在我的 train.tx
python - Caffe:在 Windows 上安装修改后的 Caffe 项目
有没有办法安装/运行修改后的 Caffe 项目，例如 SegNet或FCN-Berkley-Vision在 Windows 上？有Microsoft-led project to bring Caf
neural-network - caffe:模型定义:使用 caffe.NetSpec() 编写具有不同阶段的同一层
我想用python设置一个caffe CNN，使用caffe.NetSpec()界面。虽然我看到我们可以把测试网放在 solver.prototxt , 我想写在model.prototxt具有不同的
deep-learning - Caffe - 如何使用 pycaffe 更改 caffe 权重的数据类型？
我有一个预训练的 faster-rcnn caffemodel。我可以使用 net.params[pr][0].data 获取模型的权重。到目前为止，权重是 numpy float32 类型。我想将它
caffe - 应用 MAX 池化时 Caffe 和 Keras 之间的差异
我正在做一个将 keras json 模型转换为 caffe prototxt 的项目 caffe 支持任意填充值 keras(在 tensorflow 之上)支持“相同”和“有效”值对于 caff
java - CaffeonSpark构建'src/main/java/caffe/Caffe.java需要caffe.proto错误
我正在尝试让 CaffeOnSpark 在本地运行，并且我按照 CaffeOnSpark wiki 上的此过程进行操作:https://github.com/yahoo/CaffeOnSpark/wi
c++ - 分类 imagenet - caffe/caffe.hpp : No such a file or directory
我通过caffe使用我自己的数据集训练了网络，现在我想用C++写一个分类代码。我的机器 (linux) 仅适用于 CPU! (我使用 GPU 在 VM 中训练网络)。当我尝试“包含”特定的 Caff
caffe - 使用 caffe.NetSpec() 定义网络时，有没有办法从给定的 prototxt 中获取 "append"？
我知道可以(以编程方式)使用 caffe.Netspec() 设计一个网络，基本上主要目的是编写它的 prototxt。 net = caffe.NetSpec() .. (define) .. wi

首页

博学

6Ren·AI

商城

theano - Caffe 与 Theano MNIST 示例