- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试实现一个简单的 LSTMCell,而没有在 tf.keras.layers.LSTMCell 类中默认实现的“fancy kwargs”,遵循类似 this 的原理图模型.它没有真正的直接目的,我只是想练习实现一个比所描述的更复杂的 RNNCell here在示例部分。我的代码如下:
from keras import Input
from keras.layers import Layer, RNN
from keras.models import Model
import keras.backend as K
class CustomLSTMCell(Layer):
def __init__(self, units, **kwargs):
self.state_size = units
super(CustomLSTMCell, self).__init__(**kwargs)
def build(self, input_shape):
self.forget_w = self.add_weight(shape=(self.state_size, self.state_size + input_shape[-1]),
initializer='uniform',
name='forget_w')
self.forget_b = self.add_weight(shape=(self.state_size,),
initializer='uniform',
name='forget_b')
self.input_w1 = self.add_weight(shape=(self.state_size, self.state_size + input_shape[-1]),
initializer='uniform',
name='input_w1')
self.input_b1 = self.add_weight(shape=(self.state_size,),
initializer='uniform',
name='input_b1')
self.input_w2 = self.add_weight(shape=(self.state_size, self.state_size + input_shape[-1]),
initializer='uniform',
name='input_w2')
self.input_b2 = self.add_weight(shape=(self.state_size,),
initializer='uniform',
name='input_b2')
self.output_w = self.add_weight(shape=(self.state_size, self.state_size + input_shape[-1]),
initializer='uniform',
name='output_w')
self.output_b = self.add_weight(shape=(self.state_size,),
initializer='uniform',
name='output_b')
self.built = True
def merge_with_state(self, inputs):
self.stateH = K.concatenate([self.stateH, inputs], axis=-1)
def forget_gate(self):
forget = K.dot(self.forget_w, self.stateH) + self.forget_b
forget = K.sigmoid(forget)
self.stateC = self.stateC * forget
def input_gate(self):
candidate = K.dot(self.input_w1, self.stateH) + self.input_b1
candidate = K.tanh(candidate)
amount = K.dot(self.input_w2, self.stateH) + self.input_b2
amount = K.tanh(amount)
self.stateC = self.stateC + amount * candidate
def output_gate(self):
self.stateH = K.dot(self.output_w, self.stateH) + self.output_b
self.stateH = K.sigmoid(self.stateH)
self.stateH = self.stateH * K.tanh(self.stateC)
def call(self, inputs, states):
self.stateH = states[0]
self.stateC = states[1]
self.merge_with_state(inputs)
self.forget_gate()
self.input_gate()
self.output_gate()
return self.stateH, [self.stateH, self.stateC]
# Testing
inp = Input(shape=(None, 3))
lstm = RNN(CustomLSTMCell(10))(inp)
model = Model(inputs=inp, outputs=lstm)
inp_value = [[[[1,2,3], [2,3,4], [3,4,5]]]]
pred = model.predict(inp_value)
print(pred)
IndexError: tuple index out of range
call
在我为
self.stateC
设置值的那一行运行.在这里,我认为最初是
states
call
的论据函数是张量而不是张量列表,所以这就是我收到错误的原因。所以我加了一个
self.already_called = False
线上课
__init__
和以下部分到
call
功能:
if not self.already_called:
self.stateH = K.ones(self.state_size)
self.stateC = K.ones(self.state_size)
self.already_called = True
else:
self.stateH = states[0]
self.stateC = states[1]
merge_with_state
处的另一个错误。功能:
ValueError: Shape must be rank 1 but is rank 2 for 'rnn_1/concat' (op: 'ConcatV2') with input shapes: [10], [?,3], [].
最佳答案
好的,看来我设法解决了这个问题。事实证明,阅读文档总是有用的,在这种情况下是 docs for the RNN class .一、already_called
属性是不必要的,因为问题出在__init__
的第一行功能:state_size
属性应该是一个整数列表而不仅仅是一个整数,像这样:self.state_size = [units, units]
(因为对于大小为 units
的 LSTM,我们需要两个状态而不是一个)。当我更正它时,我得到了一个不同的错误:张量在 forget_gate
中的维度不兼容。为补充。发生这种情况是因为 RNN 一次看到整个批次,而不是单独看到批次中的每个元素(因此 None
轴 0 处的形状)。对其的修正是添加一个额外的维度 到每个张量 在轴 0 处大小为 1,如下所示:
self.forget_w = self.add_weight(shape=(1, self.state_size, self.state_size + input_shape[-1]),
initializer='uniform',
name='forget_w')
K.batch_dot
功能。所以整个工作代码如下:
from keras import Input
from keras.layers import Layer, RNN
from keras.models import Model
import keras.backend as K
class CustomLSTMCell(Layer):
def __init__(self, units, **kwargs):
self.state_size = [units, units]
super(CustomLSTMCell, self).__init__(**kwargs)
def build(self, input_shape):
self.forget_w = self.add_weight(shape=(1, self.state_size[0], self.state_size[0] + input_shape[-1]),
initializer='uniform',
name='forget_w')
self.forget_b = self.add_weight(shape=(1, self.state_size[0]),
initializer='uniform',
name='forget_b')
self.input_w1 = self.add_weight(shape=(1, self.state_size[0], self.state_size[0] + input_shape[-1]),
initializer='uniform',
name='input_w1')
self.input_b1 = self.add_weight(shape=(1, self.state_size[0]),
initializer='uniform',
name='input_b1')
self.input_w2 = self.add_weight(shape=(1, self.state_size[0], self.state_size[0] + input_shape[-1]),
initializer='uniform',
name='input_w2')
self.input_b2 = self.add_weight(shape=(1, self.state_size[0],),
initializer='uniform',
name='input_b2')
self.output_w = self.add_weight(shape=(1, self.state_size[0], self.state_size[0] + input_shape[-1]),
initializer='uniform',
name='output_w')
self.output_b = self.add_weight(shape=(1, self.state_size[0],),
initializer='uniform',
name='output_b')
self.built = True
def merge_with_state(self, inputs):
self.stateH = K.concatenate([self.stateH, inputs], axis=-1)
def forget_gate(self):
forget = K.batch_dot(self.forget_w, self.stateH) + self.forget_b
forget = K.sigmoid(forget)
self.stateC = self.stateC * forget
def input_gate(self):
candidate = K.batch_dot(self.input_w1, self.stateH) + self.input_b1
candidate = K.tanh(candidate)
amount = K.batch_dot(self.input_w2, self.stateH) + self.input_b2
amount = K.sigmoid(amount)
self.stateC = self.stateC + amount * candidate
def output_gate(self):
self.stateH = K.batch_dot(self.output_w, self.stateH) + self.output_b
self.stateH = K.sigmoid(self.stateH)
self.stateH = self.stateH * K.tanh(self.stateC)
def call(self, inputs, states):
self.stateH = states[0]
self.stateC = states[1]
self.merge_with_state(inputs)
self.forget_gate()
self.input_gate()
self.output_gate()
return self.stateH, [self.stateH, self.stateC]
inp = Input(shape=(None, 3))
lstm = RNN(CustomLSTMCell(10))(inp)
model = Model(inputs=inp, outputs=lstm)
inp_value = [[[[1,2,3], [2,3,4], [3,4,5]]]]
pred = model.predict(inp_value)
print(pred)
input_gate
中使用了 tanh 函数。为
amount
而不是 sigmoid。在这里,我在代码中对其进行了编辑,因此现在是正确的。
关于python - 使用 RNN 和 Layer 类在 Keras 中实现最小的 LSTMCell,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60185290/
我是 Keras 新手,我正在尝试获取 Keras 中的权重。我知道如何在 Python 中的 Tensorflow 中执行此操作。 代码: data = np.array(attributes, '
我正在尝试为上下文强盗问题 (https://medium.com/emergent-future/simple-reinforcement-learning-with-tensorflow-part
我尝试在单击时向 map 添加新标记,并尝试保存标题和描述以在标记悬停时显示,但出现以下错误: Cannot read property 'add Layer' of undefined Javasc
我想要一个传单图层控件,我可以在其中选择一个基础图层,并使这个基础图层本身成为一个 LayerGroup,我可以从中选择要显示的子图层。我正在考虑一个设置,我单击一个单选按钮来选择基础层(层组),然后
我在 GIMP Script-fu 和过程浏览器中遇到了一个简单的问题。 我正在尝试在具有 40 层的图像中向上/向下移动一个层。让我们调用图像 test.xcf 和所述层 Chromask-snap
我有一个(非常大的)脚本在 InDesign 中运行,该脚本在某一时刻将库资源放置到页面上,然后将其移动到特定图层。此脚本在我们这里的所有计算机上都运行良好,但仅当当时 InDesign 中没有打开其
在一些使用 tf2 的 Tensorflow 教程(例如 Neural Machine Translation with Attention 和 Eager essentials )中,他们定义了自定
现在我无法解决依赖性,怎么了? 公司会更改名称吗?但是,我在他们的网站上看到它,但没有“com.layer.atlas:layer-atlas”,但是我的应用程序包含此依赖项,谁能告诉我原因? 最佳答
我使用 Keras 并尝试将两个不同的层连接成一个向量(向量的第一个值是第一层的值,另一部分是第二层的值)。 其中一层是密集层,另一层是嵌入层。 我知道如何合并两个嵌入层或两个密集层,但我不知道如何合
我正在开发一个类来创建各种对称 AE。我现在把这个类移植到TF 2.0,比我想象的要复杂。但是,我使用层和模型的子类来实现此目的。因此,我想将多个 keras 层分组为一个 keras 层。但如果我想
我正在为 CAGradient 设置动画 let gradientChangeAnimation = CABasicAnimation(keyPath: "colors") gradientC
什么是使用 OOP 在业务逻辑对象和数据库之间分层的良好设计? 最佳答案 这些中的任何一个都可以( from Fowler's POEAA ): 数据源架构模式: 表数据网关:充当数据库表网关的对象。
我正在尝试将一些 UIImages 渲染成一张我可以保存在我的相册中的图像。但是好像 layer.renderInContext 没有考虑图层蒙版? 当前行为:照片保存,我看到了 mosaicLaye
哇,这完全令人困惑,而且 dojo 1.8 文档似乎是围绕构建层的完整 clusterf**k。有人知道那里发生了什么吗? 在构建脚本示例配置文件中,示例 amd.profile.js 有 profi
我的 spacemacs 是 0.200.3@25.1.1 每次启动spacemacs时都会收到警告,如何解决? Warnings: - dotspacemacs-configuration-laye
引用是这样的: There's no problem in Computer Science that can't be solved by adding another layer of abstr
我正在使用 Keras 并且有一个自定义层,但是当我使用它时,会发生以下错误,我不知道问题是什么。你能帮我解决这个问题吗?奇怪的是,当我在另一个系统上使用相同的代码时,没有出现此错误! import
我应该什么时候使用 Input我什么时候应该使用 InputLayer ?在 source code有一个描述,但我不确定它是什么意思。 输入层: Layer to be used as an ent
我正在尝试构建一个可以在音频和视频样本上进行训练的模型,但出现此错误 ValueError:请使用“Layer”实例初始化“TimeDistributed”层。您传递了:Tensor("input_1
我正在实现一个需要支持 mask 的自定义 tf.keras.layers.Layer。 考虑以下场景 embedded = tf.keras.layer.Embedding(input_dim=vo
我是一名优秀的程序员,十分优秀!