gpt4 book ai didi

theano - Caffe 与 Theano MNIST 示例

转载 作者:行者123 更新时间:2023-12-02 08:22:42 25 4
gpt4 key购买 nike

我正在尝试学习(和比较)不同的深度学习框架,到时候它们是 Caffe 和 Theano。

http://caffe.berkeleyvision.org/gathered/examples/mnist.html

http://deeplearning.net/tutorial/lenet.html

我按照教程在 MNIST 数据集上运行这些框架。但是,我注意到在准确性和性能方面存在很大差异。

对于 Caffe,准确率可以非常快地提高到 ~97%。事实上,只需要 5 分钟就可以完成程序(使用 GPU),最终在测试集上的准确率超过 99%。多么令人印象深刻!

然而,在 Theano 上,它要差得多。我花了 46 多分钟(使用相同的 GPU),才达到 92% 的测试性能。

我很困惑,因为在同一数据集上运行相对相同架构的框架之间不应该有太大差异。

所以我的问题是。 Caffe 报告的准确率是测试集上正确预测的百分比吗?如果是这样,是否有任何差异的解释?

谢谢。

最佳答案

Theano 和 Caffe 的示例不是完全相同的网络。我能想到的两个主要区别是 Theano 示例使用 sigmoid/tanh 激活函数,而 Caffe 教程使用 ReLU激活函数,并且 Theano 代码使用正常的 minibatch gradient descent而 Caffe 使用 momentum optimiser .这两种差异都会显着影响网络的训练时间。使用 ReLU 单元也可能会影响准确性。

请注意,Caffe 是一个深度学习框架,它已经具有许多常用功能的现成功能,例如动量优化器。另一方面,Theano 是一个符号数学库,可用于构建神经网络。但是,它不是深度学习框架。

您提到的 Theano 教程是了解卷积网络和其他神经网络在基本层面上的工作原理的绝佳资源。然而,实现所有最先进的调整将很麻烦。如果您想快速获得最先进的结果,最好使用现有的深度学习框架之一。除了 Caffe,还有许多基于 Theano 的框架。我知道keras , blocks , pylearn2 , 和我个人的最爱 lasagne .

关于theano - Caffe 与 Theano MNIST 示例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35426162/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com