python - 从 keras dropout 层中提取 dropout mask？-6ren

python - 从 keras dropout 层中提取 dropout mask？

转载作者：太空宇宙更新时间：2023-11-03 20:23:01

26

4

我想在训练时从每个批处理的顺序 Keras 模型中的 dropout 层中提取并存储 dropout mask [1/0 数组]。我想知道在 Keras 中是否有一种直接的方法可以做到这一点，或者我是否需要切换到 tensorflow ( How to get the dropout mask in Tensorflow )。

非常感谢任何帮助!我对 TensorFlow 和 Keras 还很陌生。

我尝试使用 dropout 层的几个函数(dropout_layer.get_output_mask()、dropout_layer.get_input_mask())，但在调用前一层后却没有得到None。

model = tf.keras.Sequential()
model.add(tf.keras.layers.Flatten(name="flat", input_shape=(28, 28, 1)))
model.add(tf.keras.layers.Dense(
    512,
    activation='relu',
    name = 'dense_1',
    kernel_initializer=tf.keras.initializers.GlorotUniform(seed=123),
    bias_initializer='zeros'))
dropout = tf.keras.layers.Dropout(0.2, name = 'dropout') #want this layer's mask

model.add(dropout)
x = dropout.output_mask
y = dropout.input_mask
model.add(tf.keras.layers.Dense(
    10,
    activation='softmax',
    name='dense_2',
    kernel_initializer=tf.keras.initializers.GlorotUniform(seed=123),
    bias_initializer='zeros'))

model.compile(...)
model.fit(...)

最佳答案

它在 Keras 中不容易暴露。它会深入直到调用 Tensorflow dropout。

因此，虽然您使用的是 Keras，但它也将是图中的一个张量，可以通过名称获取(找到它的名称: In Tensorflow, get the names of all the Tensors in a graph )。

这个选项当然会缺少一些 keras 信息，您可能必须在 Lambda 层内执行此操作，以便 Keras 向张量添加某些信息。而且您必须格外小心，因为即使不训练(跳过掩模)，张量也会存在

现在，您还可以使用一种不太hacky的方式，这可能会消耗一些处理:

def getMask(x):
    boolMask = tf.not_equal(x, 0)
    floatMask = tf.cast(boolMask, tf.float32) #or tf.float64
    return floatMask

使用Lambda(getMasc)(output_of_dropout_layer)

但是您需要一个功能性 API 模型，而不是使用顺序模型。

inputs = tf.keras.layers.Input((28, 28, 1))
outputs = tf.keras.layers.Flatten(name="flat")(inputs)
outputs = tf.keras.layers.Dense(
    512,
    #    activation='relu', #relu will be a problem here
    name = 'dense_1',
    kernel_initializer=tf.keras.initializers.GlorotUniform(seed=123),
    bias_initializer='zeros')(outputs)

outputs = tf.keras.layers.Dropout(0.2, name = 'dropout')(outputs)
mask = Lambda(getMask)(outputs)
#there isn't "input_mask"


#add the missing relu: 
outputs = tf.keras.layers.Activation('relu')(outputs)
outputs = tf.keras.layers.Dense(
    10,
    activation='softmax',
    name='dense_2',
    kernel_initializer=tf.keras.initializers.GlorotUniform(seed=123),
    bias_initializer='zeros')(outputs)

model = Model(inputs, outputs)
model.compile(...)
model.fit(...)

训练和预测

由于您无法训练掩模(它没有任何意义)，因此它不应该是训练模型的输出。

现在，我们可以尝试一下:

trainingModel = Model(inputs, outputs)    
predictingModel = Model(inputs, [output, mask])

但是在预测中不存在掩码，因为 dropout 仅适用于训练。所以这最终并没有给我们带来任何好处。

训练的唯一方法是使用虚拟损失和虚拟目标:

def dummyLoss(y_true, y_pred):
    return y_true #but this might evoke a "None" gradient problem since it's not trainable, there is no connection to any weights, etc.    

model.compile(loss=[loss_for_main_output, dummyLoss], ....)

model.fit(x_train, [y_train, np.zeros((len(y_Train),) + mask_shape), ...)

不保证这些会起作用。

关于python - 从 keras dropout 层中提取 dropout mask？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58033895/

26

4

0

文章推荐： javascript函数只能工作一次

文章推荐： c# - .Net IoC 如何处理构造函数中的异常？

python - "Dropout"、 "Monte-Carlo Dropout"和 "Channel-wise Dropout"有什么区别？
我遇到过上述术语，但不确定它们之间的区别。我的理解是 MC dropout 是正常的 dropout，它在测试期间也是活跃的，允许我们在多次测试运行中得到模型不确定性的估计。至于 channel-w
machine-learning - 反转 dropout 如何补偿 dropout 的影响并保持期望值不变？
我正在从 deeplearning.ai 学习神经网络中的正则化类(class)。在 dropout 正则化中，教授说如果应用 dropout，计算的激活值将小于未应用 dropout 时(测试时)。
python - Pytorch:nn.Dropout 与 F.dropout
有两种方法可以执行dropout: torch.nn.Dropout torch.nn.function.Dropout 我问: 它们之间有区别吗？我什么时候应该使用其中一种而不是另一种？当我切换
python - dropout 中的 keep_prob 值以及通过 dropout 获得最差结果
根据此链接，keep_prob 的值必须在 (0,1] 之间: Tensorflow manual 否则我会得到值错误: ValueError: If keep_prob is not in (0,
python - 从 keras dropout 层中提取 dropout mask？
我想在训练时从每个批处理的顺序 Keras 模型中的 dropout 层中提取并存储 dropout mask [1/0 数组]。我想知道在 Keras 中是否有一种直接的方法可以做到这一点，或者我是
Keras:LSTM dropout 和 LSTM recurrent dropout 的区别
来自 Keras 文档: dropout:在 0 和 1 之间 float 。要丢弃的单位分数输入的线性变换。 recurrent_dropout:在 0 和 1 之间 float 。 drop 用
python - 任何 keras 层中的 dropout 层和 dropout 参数有什么区别
keras中的Dropout层与dropout和recurrent_droput参数有什么区别？它们都有相同的目的吗？示例: model.add(Dropout(0.2)) # layer mod
tensorflow :tf.nn.dropout 和 tf.layers.dropout 有什么区别
我很困惑是使用 tf.nn.dropout 还是 tf.layers.dropout。许多 MNIST CNN 示例似乎使用 tf.nn.droput，将 keep_prop 作为参数之一。但它与
keras - 如何在 keras 上的变分 dropout LSTM 层上使用 MC Dropout？
我目前正在尝试使用 Keras( tensorflow 后端)建立一个(LSTM)循环神经网络。我想使用带有 MC Dropout 的变分 dropout。我相信变分 dropout 已经通过 LST
tensorflow - 如何正确使用变分循环 dropout
tensorflow config dropout wrapper具有可以设置的三种不同的丢失概率:input_keep_prob、output_keep_prob、state_keep_prob。
tensorflow - 如何正确使用变分循环 dropout
tensorflow config dropout wrapper具有可以设置的三种不同的丢失概率:input_keep_prob、output_keep_prob、state_keep_prob。
pytorch - 在pytorch中实现word dropout
我想在我的网络中添加 word dropout，以便我可以有足够的训练示例来训练“unk”标记的嵌入。据我所知，这是标准做法。假设unk token的索引为0，padding的索引为1(方便的话我们可
Keras Dropout 层模型预测
dropout 层只应该在模型训练期间使用，而不是在测试期间使用。如果我的 Keras 序列模型中有一个 dropout 层，我是否需要在做之前做一些事情来删除或沉默它 model.predict(
使用 Dropout 时的验证损失
我试图了解辍学对验证平均绝对误差(非线性回归问题)的影响。无辍学辍学率为 0.05 辍学率为 0.075 在没有任何 dropouts 的情况下，验证损失大于训练损失，如1所示。我的理解是，验证损
python - 为什么我不能在千层面回归模型的最后一层使用 dropout？
玩具回归示例。使用 dropout=0.0 这很好用并且成本降低了。使用 dropout=0.5 我得到错误: ValueError: Got num_leading_axes=1 for a 1-d
pytorch - 在训练期间更改 Dropout 值
如何在训练期间更改 Dropout？例如 Dropout= [0.1, 0.2, 0.3] 我尝试将其作为列表传递，但我无法使其工作。最佳答案要在训练过程中改变 dropout 概率，您应该使用
python - 我的带有蒙特卡洛 dropout 的模型是否应该提供类似于确定性预测的平均预测？
我有一个用多个 LayerNormalization 层训练的模型，我不确定在激活 dropout 进行预测时简单的权重转移是否正常工作。这是我正在使用的代码: from tensorflow.ker
neural-network - dropout 可以提高训练数据的性能吗？
我正在训练一个带有 dropout 的神经网络。碰巧的是，当我将 dropout 从 0.9 减少到 0.7 时，训练数据数据的损失(交叉验证错误)也会减少。我还注意到，随着我减少 dropout 参
tensorflow - Dropout 层在测试/训练阶段的行为
根据 Keras 文档，dropout 层在训练和测试阶段表现出不同的行为: Note that if your model has a different behavior in training
neural-network - 为什么在验证和测试期间禁用 dropout？
我已经在多个地方看到您应该在验证和测试阶段禁用 dropout，并且只在训练阶段保留它。有什么理由让这种情况发生吗？我一直找不到一个很好的理由，只是想知道。我问的一个原因是因为我训练了一个带有 dr

首页

博学

6Ren·AI

商城

python - 从 keras dropout 层中提取 dropout mask？

训练和预测