gpt4 book ai didi

machine-learning - 了解 "Deep MNIST for Experts"

转载 作者:行者123 更新时间:2023-11-30 09:25:43 26 4
gpt4 key购买 nike

我试图理解Deep MNIST for Experts 。我非常清楚神经网络和深度学习如何在高层次上工作,但我很难理解细节。

在本教程中,首先编写并运行一个简单的单层模型。这包括定义模型 x*W+b、计算熵、通过梯度下降最小化熵并评估结果。

我发现第一部分很容易运行和理解。

在第二部分中,构建一个简单的多层网络,并应用一些卷积和池化。然而,事情开始变得棘手。他们写道:

We can now implement our first layer. It will consist of convolution, followed by max pooling. The convolutional will compute 32 features for each 5x5 patch.

5x5 的补丁应等于 25 像素。正确的?为什么要从 25 个像素中提取 32 个特征?为什么您需要比数据点更多的功能?这有什么意义呢?感觉就像他们正在将问题从 25 维“升级”到 32 维。感觉32个维度中的7个应该是多余的。

其次。卷积使用函数truncated_normal它只是选择接近平均值的随机值。为什么这是一个很好的手写数字建模模型?

第三。网络的第二层似乎又做了同样的事情。层数越多越好吗?我可以用单层获得相同的结果吗?

最佳答案

我认为视觉模型可以大大降低理解的难度,所以也许这可以帮助你更好地理解:

http://scs.ryerson.ca/~aharley/vis/conv/

这是一个卷积神经网络的 3D 可视化,它有两个卷积层,后面是两个最大池化层,您可以单击每个层中的 3D 立方体来检查值。

关于machine-learning - 了解 "Deep MNIST for Experts",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38201178/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com