python - MXNET 与 Theano 体验-6ren

python - MXNET 与 Theano 体验

转载作者：太空宇宙更新时间：2023-11-03 15:02:42

27

4

我想做一些分布式计算。使用 GPU 进行机器学习？只是想知道是否有人有使用 MXNET 的经验(perf. vs Theano)

引用资料 http://www.cs.cmu.edu/~muli/file/mxnet-learning-sys.pdf

谢谢

最佳答案

我在 mxnet 和 Theano 方面都有很多经验(通过 lasagne 和 keras)

基准测试总是有偏见的，所以我不会对此发表评论，只是要注意所有框架都非常快。以下是可以帮助您做出决定的几件事:

Theano 与 mxnet 相比就像汇编与 python 相比。 Theano 具有构建机器学习模型的低级原语，并且其本身不定义任何层或优化器，您通常将它与一些深度学习库一起使用，例如 Lasagne 或 Keras，而 mxnet 是更高级别。因此票价比较将是 mxnet 与 Keras，而不是 mxnet 与 Theano。
mxnet 是一个较新的库，其中的某些内容还没有完善，在线资源比 Theano 少得多。
Theano(以及 Lasagne 和 Keras)在首次将模型运行到 C++ 和 Cuda 时将它们编译，这非常慢。对于非常复杂的模型，例如展开的 LSTM，编译可能需要几分钟时间。与模型训练所需的时间(几小时到几周)相比，它通常非常短，但在您制作原型(prototype)时却非常烦人。

总的来说，如果你在这两个框架之间做出选择，我建议 Theano + Keras 用于除了循环或非常深的网络之外的所有东西，否则 Theano 中的编译会杀死你。

另请查看 TensorFlow。它(主观上)比 mxnet 慢，但更成熟并且在线资源更多。

关于python - MXNET 与 Theano 体验，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36126570/

27

4

0

文章推荐： Python Eventlet 产卵不起作用

文章推荐： android - Android 和 Windows Phone 之间的 SSL 连接区别

文章推荐： apache - 在 Ubuntu/Apache2 上设置 SSL 时无法建立 SSL 连接

文章推荐： python - 递归神经网络中的时期与迭代

mxnet - 如何显式使用矩阵和矩阵运算在 MXNet 中构建模型？
我可以使用诸如 FullyConnected 之类的预构建高级函数来创建模型。 .例如: X = mx.sym.Variable('data') P = mx.sym.FullyConnected(
mxnet - 如何将元素附加到 mxnet NDArray？
在 numpy 中，可以使用 np.append() 将元素附加到数组。尽管 numpy 和 mxnet 数组应该是相似的，但 NDArray 类中没有append() 函数。更新(18/04/2
mxnet - 如何将元素附加到 mxnet NDArray？
在 numpy 中，可以使用 np.append() 将元素附加到数组。尽管 numpy 和 mxnet 数组应该是相似的，但 NDArray 类中没有append() 函数。更新(18/04/2
mxnet - mxnet 中有关于 multiplecpu 的概念吗
据我们所知，mxnet中有multiplegpu的概念，当在命令中指定-gpu时。如果我们不指定gpu，它将在cpu上运行。它运行多少个cpu？可以指定吗多个 CPU？最佳答案您可以通过以下代码使
mxnet - 自定义 MXNet 运算符和 kAddTo
我正在 MXNet 中编写 C++ 自定义运算符，但无法找到有关何时在运算符调用中设置 kAddTo 的文档。作为一个最小的例子，假设我的新运算符称为 foo()，我想执行以下计算: A = mx.s
MXNET 自定义损失函数和 eval_metric
如何在 MXNET 中创建自定义损失函数？例如，我不想计算一个标签的交叉熵损失(使用标准 mx.sym.SoftmaxOutput 层计算交叉熵损失并返回一个可以作为损失符号传递给拟合函数的符号)，而
python - MxNet:推断大型图像数据集的好方法
我有数百万张图像可供推断。我知道如何编写自己的代码来创建批处理并将批处理转发到使用 MxNet Module API 训练过的网络为了得到预测。然而，创建批处理会导致大量未特别优化的数据操作。在自己
python - Mxnet - 了解密集层的权重形状
我正在了解 Mxnet 框架。在关注此 Linear Regression article 时我看到以下代码正在创建一个密集层: net = gluon.nn.Dense(1, in_units=2)
python - mxnet 训练图像分类模型
由于没有分步指南来学习如何使用 mxnet 来训练图像分类模型或提高已经存在的模型的准确性，例如，我有 5 个类 iamges，我想训练一个模型可以很好地将这5类东西分类。另外，mxnet 指南找不到
python - Mxnet 元素明智的相乘
在 MXNet 中，如果我想创建一个权重向量来乘以每个输入，即具有 w*x_i 然后反向传播权重 w 我将如何做这个？我试过: y_hat = input w1 = mx.sym.Variabl
python - MXNet 后向形状不一致
升级到 MXNet 0.11.0 后，我的旧代码中出现奇怪的错误: 使用 scikit-learn 的波士顿住房数据集: data = mx.sym.Variable("data") y = mx.s
python - mxnet 模型并行性的简单示例
Guon mxnet 教程中的简单示例对于我们这些刚刚开始使用 mxnet 的人来说非常有帮助。到目前为止，还没有一个简单的模型并行示例。我看到 LSTM 的模型并行性示例代码，但我是 mxnet 的
python - MXNet 打印中间符号值
我如何找到 MXNet 符号中保存的实际数值。假设我有， x = mx.sym.Variable('x') y = mx.sym.Variable('y') z = x + y, 如果 x = [1
r - 使用 MXnet 时如何保存模型
我正在使用 MXnet 来训练 CNN(在 R 中)，我可以使用以下代码训练模型而不会出现任何错误: model <- mx.model.FeedForward.create(symbol=netwo
mxnet - TFRecord 与 RecordIO
TensorFlow 对象检测 API 更喜欢 TFRecord 文件格式。 MXNet 和 Amazon Sagemaker 似乎使用 RecordIO 格式。这两种二进制文件格式有何不同，或者它们
c++ - Mxnet C++ API的输出值
我正在尝试使用其C++ API在Mxnet中实现自定义损失函数。损失函数的问题在python(how to use customized loss function with mxnet?)中已经提出
r - mxnet LinearRegressionOutput 性能不佳
我无法使用 mxnet 获得合理的性能LinearRegressionOutput层。下面的独立示例尝试对一个简单的多项式函数 (y = x1 + x2^2 + x3^3) 执行回归，并引入少量随机
python - 在 mxnet 中高效创建压缩带状对角矩阵
在我的问题中，我有一个包含 n 元素的向量。给定窗口大小 k，我想有效地创建一个包含带状对角线的矩阵大小 n x 2k+1。例如: a = [a_1, a_2, a_3, a_4] k = 1 b =
machine-learning - MXNet - 将标量乘以数组会导致零
我正在尝试实现mxnet教程in this page ，在计算梯度体面时: def SGD(params, lr): for param in params: param[:] = param
machine-learning - mxnet 训练没有进展
预先感谢您的帮助。我在让 mxnet 模型收敛到任何东西时遇到一些问题:它似乎接近其初始权重。一个工作示例(尽管我今天一直在努力让许多这样的模型工作)。我已经尝试了下面的方法，使用了一系列纪元(最

首页

博学

6Ren·AI

商城

python - MXNET 与 Theano 体验