- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我一直在努力用 Python 编写神经网络。我正在尝试让它识别 MNIST 图像。
我想我在初始化权重时一定做错了什么。
我的假设是,由于 MNIST 数据是形状为 28x28 的数据,因此第一组权重的形状应为 (28, some),最后一组权重的形状应为 (X, 1), X 是数据集中的类数。
我感到困惑的一件事是我的结束矩阵(下面的变量 l5)具有形状 (28, 1)。 我需要做什么才能使输出的形状为 (9, 1)?我已经打印了这些形状,并意识到我对神经网络和线性代数的理解存在差距:
l5 shape: (28, 1)
l4 shape: (28, 9)
l3 shape: (28, 14)
l2 shape: (28, 21)
l1 shape: (28, 28)
我认为理论上我可以做一个 SVM(支持向量机)并将形状为 (784, 1) 的(展平)图像与矩阵 (784, 9) 相乘,但我不确定这是否是唯一的这样做的方法,但如果实际上,我与我所拥有的东西相去甚远。
以下代码,基于本教程:http://iamtrask.github.io/2015/07/12/basic-python-network/ :
syn0 = np.random.random((28, 28))
syn1 = np.random.random((28, 21))
syn2 = np.random.random((21, 14))
syn3 = np.random.random((14, 9))
syn4 = np.random.random((9, 1))
images, labels = mndata.load_training()
print(len(images))
for index, image in enumerate(images):
X = np.array(image).reshape((28, 28))
print(X)
y = np.zeros((9)) # getImageCategory(fileName)
y[labels[index]] = 1
print(y)
l0 = X
l1 = sigmoid(np.dot(l0, syn0)) # + bias?
l2 = sigmoid(np.dot(l1, syn1)) # + bias?
l3 = sigmoid(np.dot(l2, syn2)) # + bias?
l4 = sigmoid(np.dot(l3, syn3)) # + bias?
l5 = sigmoid(np.dot(l4, syn4)) # + bias?
print("l5 shape: " + str(l5.shape))
print("l4 shape: " + str(l4.shape))
print("l3 shape: " + str(l3.shape))
print("l2 shape: " + str(l2.shape))
print("l1 shape: " + str(l1.shape))
print("Y shape: " + str(y.shape))
l5_error = y - l5
if index % 10 == 0:
print("Error: " + str(np.mean(np.abs(l5_error)))) # +" | Prediction: " + str(l5))
l5_delta = l5_error * sigmoid(l5, True) # True = derivative of sigmoid
l4_error = l5_delta.dot(syn4.T)
l4_delta = l4_error * sigmoid(l4, True) # True = derivative of sigmoid
l3_error = l4_delta.dot(syn3.T)
l3_delta = l3_error * sigmoid(l3, True) # True = derivative of sigmoid
l2_error = l3_delta.dot(syn2.T)
l2_delta = l2_error * sigmoid(l2, True) # True = derivative of sigmoid
l1_error = l2_delta.dot(syn1.T)
l1_delta = l1_error * sigmoid(l1, True) # True = derivative of sigmoid
# print("layer_4_delta shape: " + str(l4_delta.shape))
# print("layer_3_delta shape: " + str(l3_delta.shape))
# print("layer_2_delta shape: " + str(l2_delta.shape))
# print("layer_1_delta shape: " + str(l1_delta.shape))
# print("L1 Error" + str(layer_1_delta) + " | L2 Error: " + str(layer_2_delta) + " | L3 Error: " + str(layer_3_delta) + " | L4 Error: " + str(layer_4_delta))
# update weights
syn4 += l4.T.dot(l5_delta)
syn3 += l3.T.dot(l4_delta)
syn2 += l2.T.dot(l3_delta)
syn1 += l1.T.dot(l2_delta)
syn0 += l0.T.dot(l1_delta)
另外,我知道反向传播是找到输出的梯度并更新权重以根据适应度函数最小化误差(现在我想起来我可能会忽略它?)。 我不明白为什么在更新权重和计算图层误差时必须转置图层。
我收到的当前错误如下,但我确信我的代码还有其他问题
Traceback (most recent call last):
File "C:\Users\Username\Development\Python\updatedKernel.py", line 128, in <module>
main()
File "C:\Users\Username\Development\Python\updatedKernel.py", line 104, in main
l4_error = l5_delta.dot(syn4.T)
ValueError: shapes (28,9) and (1,9) not aligned: 9 (dim 1) != 1 (dim 0)
最佳答案
通常
输入(MNIST 数据)的形状为 (nb_samples_in_bacth, input_dimensions),其中 input_dimensions = 784 = 28*28
第一组权重的形状为(input_dimensions,hidden_dimension),其中input_dimensions = 784 = 28*28,hidden_dimension由用户设置(通常应与input_dimension的数量级相同)。
第二个权重的形状为 (hidden_dimension, nb_classes),其中 nb_class = 10(对于 MNIST 中的 10 位数字)。
最终输出的形状应为 (nb_samples_in_batch, nb_classes)
关于python - Python 中的神经网络 - 权重矩阵形状和反向传播遇到问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43905394/
我是 TensorFlow 菜鸟。我已经从 deeppose 的开源实现中训练了一个 TensorFlow 模型,现在必须针对一组新图像运行该模型。 该模型是在大小为 100 * 100 的图像上训练
我正在尝试以这种方式设置节点的大小: controller[shape=circle,width=.5,label="Controller",style=filled,fillcolor="#8EC1
是否有 VBA 代码可以在选择的每个单元格周围添加文本框。文本框应该是单元格的大小(类似于边框)? 最佳答案 您可以使用 .AddTextbox方法。循环遍历您选择的单元格,并使用单元格的尺寸属性来设
我有一个变量 a尺寸 (1, 5) 我想“平铺”的次数与我的小批量的大小一样多。例如,如果小批量大小为 32,那么我想构造一个张量 c维度为 (32, 5),其中每一行的值与原始 (1, 5) 变量
我在使用 javaFX 时遇到问题。我想每 1000 毫秒在应用程序窗口中显示一次时间。 public class Main extends Application { StackPane root
所以我目前正在创建这个 API。这个登录类应该只创建一个场景,其中包含制作 GUI 所需的所有框。我遇到的问题是,单击时我的形状不会执行任何操作。我有事件监听器,但它不起作用。 import
我正在用 python turtle 画一些东西,我使用了形状函数,但是形状 overdraw 了它们之前的其他形状(我可以看到形状在移动),并且我只得到了最后一个形状: `up() goto(-20
我正在读取多个 .csv 文件作为具有相同形状的 panda DataFrame。对于某些索引,某些值为零,因此我想选择具有相同形状的每个索引的值,并为相同的索引放置零值并删除零以成为相同的形状: a
我有一个简单的二维网格,格式为 myGrid[x,y] 我正在尝试找到一种方法来找到围绕选定网格的周长,这样我就有了一个可供选择的形状。 这是我的意思的一个例子: 这里的想法是找到所有相关的“角”,也
我有一个网络层,用于调用多个端点。我想减少重复代码的数量,并认为也许我可以将响应模型作为端点的一部分传递。 这个想法是不需要多个仅因响应而不同的函数,我可以调用我的网络层并根据路径进行设置。 我看到的
我正在创建一个自定义 ImageView,它将我的图像裁剪成六边形并添加边框。我想知道我的方法是否正确,或者我是否以错误的方式这样做。有很多自定义库已经在执行此操作,但开箱即用的库中没有一个具有我正在
我正在编写一些代码,这些代码需要识别一些基于节点云的相当基本的几何图形。我会对检测感兴趣: 板(简单有界平面) 圆柱体(两个节点循环) 半圆柱(圆弧+直线+圆弧+直线) 圆顶(n*loop+top n
我有这个形状: http://screencast.com/t/9UUhAXT5Wu 但边界在截止点处没有跟随它 - 我该如何解决? 这是我当前 View 的代码: self.view.backgro
我现在脑震荡,所以我想问一个非常简单的问题。 目前,我正在尝试打印出这样的开头 当输入为 7 时,输出为 * ** * ** * ** * 这里是我的代码,它打印 14 次而不是 7 次,或者当我输入
我想生成如下设计。计划选项卡顶部的"new"。我使用的属性适用于 chrome 和 mozilla,但在 Edge 中出现故障。 以下是我在 chrome 中应用的样式: a.subnav__item
我想要一个带有两种颜色边框轮廓的 shape 元素。我可以使用 solid 元素做一个单一的颜色轮廓,但这只允许我画一条线。我尝试在我的形状中使用两个 stroke 元素,但这也不起作用。 有没有办法
我需要为屏幕上的形状着色任何我想要的颜色。我目前正在尝试使用 UIImage 来执行此操作,我想根据自己的需要重新着色。据我所知,执行此操作的唯一方法是获取 UIImage 的各个像素,这需要更多我想
因此,经过多年的 OOP,我从我的一门大学类(class)中得到了一个非常简单的家庭作业,以实现一个简单的面向对象的结构。 要求的设计: 实现面向对象的解决方案以创建以下形状: 椭圆、圆形、正方形、矩
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 5 年前。 Improve this qu
我想知道是否可以使用类似于以下的 div 制作复杂的形状: 它基本上是一个四 Angular 向内收缩的圆 Angular 正方形。目标是使用背景图像来填充它。我可以使用具有以下 SVG 路径的剪辑蒙
我是一名优秀的程序员,十分优秀!