作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试实现 Deep Mind 的 DNC - Nature paper - 使用 PyTorch 0.4.0。
在实现他们使用的 LSTM 变体时,我遇到了一些维度问题。
为简化起见,假设 BATCH=1。
其中 [x;h]
表示将 x
和 h
连接成一个向量,而 i
>、f
和 o
是列向量。
我的问题是如何计算状态s_t
。
第二个附录是通过将 i
与列向量相乘获得的,因此结果要么是标量(首先转置 i
,然后进行标量积),要么是错误的(两个列向量乘以)。
因此状态会产生一个标量...
出于同样的原因,隐藏状态 h_t
也是一个标量,但它必须是一个列向量。
显然我在某个地方错了,但我不知道错在哪里。
最佳答案
关于machine-learning - Deep Mind 可微神经计算机 (DNC) 中 LSTM 变体的维度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51516943/
我是一名优秀的程序员,十分优秀!