- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试学习(和比较)不同的深度学习框架,到时候它们是 Caffe 和 Theano。
http://caffe.berkeleyvision.org/gathered/examples/mnist.html
和
http://deeplearning.net/tutorial/lenet.html
我按照教程在 MNIST 数据集上运行这些框架。但是,我注意到在准确性和性能方面存在很大差异。
对于 Caffe,准确率可以非常快地提高到 ~97%。事实上,只需要 5 分钟就可以完成程序(使用 GPU),最终在测试集上的准确率超过 99%。多么令人印象深刻!
然而,在 Theano 上,它要差得多。我花了 46 多分钟(使用相同的 GPU),才达到 92% 的测试性能。
我很困惑,因为在同一数据集上运行相对相同架构的框架之间不应该有太大差异。
所以我的问题是。 Caffe 报告的准确率是测试集上正确预测的百分比吗?如果是这样,是否有任何差异的解释?
谢谢。
最佳答案
Theano 和 Caffe 的示例不是完全相同的网络。我能想到的两个主要区别是 Theano 示例使用 sigmoid/tanh 激活函数,而 Caffe 教程使用 ReLU激活函数,并且 Theano 代码使用正常的 minibatch gradient descent而 Caffe 使用 momentum optimiser .这两种差异都会显着影响网络的训练时间。使用 ReLU 单元也可能会影响准确性。
请注意,Caffe 是一个深度学习框架,它已经具有许多常用功能的现成功能,例如动量优化器。另一方面,Theano 是一个符号数学库,可用于构建神经网络。但是,它不是深度学习框架。
您提到的 Theano 教程是了解卷积网络和其他神经网络在基本层面上的工作原理的绝佳资源。然而,实现所有最先进的调整将很麻烦。如果您想快速获得最先进的结果,最好使用现有的深度学习框架之一。除了 Caffe,还有许多基于 Theano 的框架。我知道keras , blocks , pylearn2 , 和我个人的最爱 lasagne .
关于theano - Caffe 与 Theano MNIST 示例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35426162/
// Assuming that data are on the CPU initially, and we have a blob. const Dtype* foo; Dtype* bar;
我计划使用 NYU depth v2 数据集实现一个 CNN,它可以从单个图像估计深度。通过本教程,我了解到在 Caffe 上实现处理分类问题的 CNN 很容易。我很好奇 Caffe 是否适合涉及多维
我用图像训练了一个模型。现在想将 fc-6 功能提取到 .npy 文件中。我正在使用 caffe.set_mode_gpu() 运行 caffe.Classifier 并提取特征。 而不是每帧提取和保
我通过 apt install 命令在我的 Ubuntu v18 VM 上安装了 caffe-cpu。我正在努力找出安装目录所在的位置,如果我错了请纠正我,但我相信没有安装目录。我尝试执行的 NN 模
这个问题在这里已经有了答案: how to calculate a net's FLOPs in CNN [closed] (4 个回答) 4年前关闭。 我在tensorflow tutorial看到
似乎this related PR现在已经死了,有没有解决方法可以使用 early stopping在咖啡厅?也许在 Caffe 之上使用 Python? 最佳答案 第一部分很容易手动完成:让我们监控
当我尝试在MacbookPro(El Capitan)上安装最新的caffe时,出现以下错误。怎么了?如何解决? 我在此网站上发现了一些类似的问题,不幸的是显示的修复似乎是ubuntu特有的。 先感谢
average_loss有什么用?有人可以举一个例子或用外行的术语解释吗? 最佳答案 您可以登录 caffe.proto文件。当前版本中的第 151 行对 average_loss 给出了以下注释:
我想先分别处理不同类型的数据,然后将它们融合到一个公共(public)层中。这在 Caffe 中是否可行,如果可以,最好的方法是什么? 我读过可以在同一个 prototxt 文件中定义多个数据层。但是
我正在尝试将几个底部 Blob 合并为一个顶部 Blob ,然后将其馈送到下一层。 这些 Blob 来自不同的卷积/FC层,因此它们的形状不同。 我尝试了 concat 层,但使用轴 0 或 1 时,
包 Digits 需要使用 Caffe 安装目录的位置设置环境变量。 安装Caffe的简单方法是apt-get install caffe-cuda .但是,我无法弄清楚它的安装位置。没有安装在hom
我在 Caffe 中训练过 imagenet。现在我正在尝试为我的模型和 caffe 提供的训练模型计算 ROC/AUC。我有两个问题: 1) ROC/AUC 主要用于二进制类,但我也发现在某些情况下
我正在尝试使我的 Caffe 代码适应 tensorflow。我想知道将我的 train.txt 和 test.txt 转换为适用于 tensorflow 的最佳方法是什么。 在我的 train.tx
有没有办法安装/运行修改后的 Caffe 项目,例如 SegNet或FCN-Berkley-Vision在 Windows 上? 有Microsoft-led project to bring Caf
我想用python设置一个caffe CNN,使用caffe.NetSpec()界面。虽然我看到我们可以把测试网放在 solver.prototxt , 我想写在model.prototxt具有不同的
我有一个预训练的 faster-rcnn caffemodel。我可以使用 net.params[pr][0].data 获取模型的权重。到目前为止,权重是 numpy float32 类型。我想将它
我正在做一个将 keras json 模型转换为 caffe prototxt 的项目 caffe 支持任意填充值 keras(在 tensorflow 之上)支持“相同”和“有效”值 对于 caff
我正在尝试让 CaffeOnSpark 在本地运行,并且我按照 CaffeOnSpark wiki 上的此过程进行操作:https://github.com/yahoo/CaffeOnSpark/wi
我通过caffe使用我自己的数据集训练了网络,现在我想用C++写一个分类代码。我的机器 (linux) 仅适用于 CPU! (我使用 GPU 在 VM 中训练网络)。 当我尝试“包含”特定的 Caff
我知道可以(以编程方式)使用 caffe.Netspec() 设计一个网络,基本上主要目的是编写它的 prototxt。 net = caffe.NetSpec() .. (define) .. wi
我是一名优秀的程序员,十分优秀!