python - 有效地向模型中的所有可训练权重添加噪声-6ren

python - 有效地向模型中的所有可训练权重添加噪声

转载作者：行者123 更新时间：2023-12-04 03:50:14

26

4

如何在 tf.fuction 中有效访问 Keras 模型的所有可训练变量将自定义噪声添加到全部变量？
让我们假设这个简单的模型:

my_model = Sequential()
my_model.add(Dense(300, input_dim=40, activation='relu'))
my_model.add(Dense(200, activation='relu'))
my_model.add(Dense(8, activation='sigmoid'))

热切地运行，我可以通过以下方式做到这一点:

@tf.function
def weight_perturbation(model, generator):
    n_layers = len(model.layers)

    # iterate over all layers
    for i in tf.range(n_layers):
        trainable_weights = model.layers[i].trainable_variables

        # iterate over all weight vectors in a layer 
        for j in tf.range(len(trainable_weights)):
            trainable_weights[j].assign_add(generator.normal(tf.shape(trainable_weights[j]), dtype=tf.float64))

但是，当不急切地运行时，我收到以下错误:

     trainable_weights = model.layers[i].trainable_variables

TypeError: list indices must be integers or slices, not Tensor

我怎样才能规避这个问题？我看了 tf.gather但这似乎不适用于列表。
最好的是，如果有一种方法可以将模型的所有可训练权重作为扁平张量而不循环。不幸的是，我还没有找到这样的东西。

最佳答案

如果我遍历层和权重而不是遍历 tf.range，它对我有用:

def weight_perturbation(model):
    for layer in model.layers:
        trainable_weights = layer.trainable_variables

        for weight in trainable_weights :
            random_weights = tf.random.uniform(tf.shape(weight), 
                                               1e-4, 1e-5, dtype=tf.float32)
            weight.assign_add(random_weights)

我将您的数据类型更改为 tf.float32 ，在大多数情况下应该是这样。我在这里添加了重量操作:

import tensorflow as tf
from tensorflow import keras as K
from tensorflow.keras.layers import Conv2D, Flatten, Dense, MaxPooling2D, Dropout
from tensorflow import nn as nn
from functools import partial

(xtrain, ytrain), (xtest, ytest) = tf.keras.datasets.mnist.load_data()

train = tf.data.Dataset.from_tensor_slices((xtrain, ytrain))
test = tf.data.Dataset.from_tensor_slices((xtest, ytest))

def prepare(inputs, outputs):
    inputs = tf.cast(inputs, tf.float32)
    inputs = tf.divide(x=inputs, y=255)
    inputs = tf.expand_dims(inputs, -1)
    targets = tf.one_hot(outputs, depth=10)
    return inputs, targets

train = train.map(prepare).batch(64)
test = test.map(prepare).batch(64)

class MyCNN(K.Model):
    def __init__(self):
        super(MyCNN, self).__init__()
        Conv = partial(Conv2D, kernel_size=(3, 3), activation=nn.relu)
        MaxPool = partial(MaxPooling2D, pool_size=(2, 2))

        self.conv1 = Conv(filters=8)
        self.maxp1 = MaxPool()
        self.conv2 = Conv(filters=8)
        self.maxp2 = MaxPool()
        self.flatt = Flatten()
        self.dens1 = Dense(8, activation=nn.relu)
        self.drop1 = Dropout(.5)
        self.dens2 = Dense(10, activation=nn.softmax)

    def call(self, x, training=None, **kwargs):
        x = self.conv1(x)
        x = self.maxp1(x)
        x = self.conv2(x)
        x = self.maxp2(x)
        x = self.flatt(x)
        x = self.dens1(x)
        x = self.drop1(x)
        x = self.dens2(x)
        return x

model = MyCNN()

loss_object = tf.losses.CategoricalCrossentropy(from_logits=False)

def compute_loss(model, x, y, training):
  out = model(inputs=x, training=training)
  loss = loss_object(y_true=y, y_pred=out)
  return loss, out

def get_grad(model, x, y):
    with tf.GradientTape() as tape:
        loss, out = compute_loss(model, x, y, training=False)
    return loss, tape.gradient(loss, model.trainable_variables), out

def weight_perturbation(model):
    for layer in model.layers:
        trainable_weights = layer.trainable_variables

        for weight in trainable_weights :
            random_weights = tf.random.uniform(tf.shape(weight),
                                               1e-4, 1e-5, dtype=tf.float32)
            weight.assign_add(random_weights)

optimizer = tf.optimizers.Adam()

verbose = "Epoch {:2d} Loss: {:.3f} TLoss: {:.3f} Acc: {:.3%} TAcc: {:.3%}"

for epoch in range(1, 10 + 1):
    train_loss = tf.metrics.Mean()
    train_acc = tf.metrics.CategoricalAccuracy()
    test_loss = tf.metrics.Mean()
    test_acc = tf.metrics.CategoricalAccuracy()

    weight_perturbation(model)

    for x, y in train:
        loss_value, grads, out = get_grad(model, x, y)
        optimizer.apply_gradients(zip(grads, model.trainable_variables))
        train_loss.update_state(loss_value)
        train_acc.update_state(y, out)

    for x, y in test:
        loss_value, _, out = get_grad(model, x, y)
        test_loss.update_state(loss_value)
        test_acc.update_state(y, out)

    print(verbose.format(epoch,
                         train_loss.result(),
                         test_loss.result(),
                         train_acc.result(),
                         test_acc.result()))

关于python - 有效地向模型中的所有可训练权重添加噪声，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64542231/

26

4

0

文章推荐： java - 有线着色问题 Android EditText

文章推荐： ruby-on-rails - 根据虚拟属性设置事件记录属性

文章推荐： r - 时间序列和 MA 模型在 R 中看起来相同

mysql - 如何根据用户声誉计算输入的重要性/权重？
我有几个系统，其中包含用户表以及某种形式的业力/权重/声誉。有时是用户发布的帖子数量，有时是用户在网站上的所有事件中收到的赞成/反对票数。 USER { id int name str
带有边距和填充的 Android 权重
我需要能够使用填充的相对大小 - 根据设备的分辨率和 dpi 变大或变小。例如，如果我的 View 宽度为 100 像素，我希望左侧填充 10 像素，右侧填充 10 像素。但是，如果它在更高密度的屏
search - Solr:如何指定字段相关性/权重
我目前正在使用由大约 10 个字段组成的 Solr 索引数据。当我执行搜索时，我希望某些字段的权重更高。谁能帮我指出正确的方向？例如，在所有字段中搜索“超人”等术语时，应在“Description”
r - 根据节点属性(权重)在网络中添加关系
我正在使用 igraph 模拟网络随时间的变化在 r并且我正在寻找一种有效且可扩展的方式来对此进行编码以用于业务。网络变化的主要驱动因素是: 新增节点新领带新节点权重在第一阶段，在 100 个
c++ - 使用OpenVINO上的c++ API获取模型每一层的参数/权重
我一直在寻找一种使用OpenVINO框架上的C++ API获取网络每一层权重/参数和偏差张量的方法。我在文档中找不到任何内容，在示例中也找不到任何示例。我如何提取这些张量？谢谢，塞萨尔编辑: 分
PHP memcache::addServer, 权重
我的问题与 PHP Memcache 扩展的 addServer 函数中的“weight”参数有关。在过去的几个月里，我一直在为所有服务器使用“weight = 1”。我现在正在尝试应用以下配置以最
java - 自定义数据结构(元素+权重)
我应该使用哪种数据结构来保持元素按给定权重排序？我需要在集合中添加元素，其中每个元素都会生成特定的权重，但该权重不包含(也不计算)在元素本身内部；它是由元素之外的其他人计算的。而且，权重不需要存储(但
python - 在分类焦点损失中使用 1-a 权重
我正在尝试在 keras/tensorflow 中使用具有多个类的焦点损失，这导致使用我猜的分类焦点损失。我找到了一些实现here和 there或there 。据我了解，焦点损失中的参数a主要用于二
python - Pandas value_counts() + 权重
我有一个像这样的 Pandas 数据框: df = pd.DataFrame({'id': [121, 34324, 111, 12, 45, 232], 'weight'
python - 充当线性缩放的 Tensorflow 权重
我有一个带有输出神经元的神经网络，我想在软最大化之前使用经过训练的权重进行线性缩放。我有 10 个输出，我想要 10 个权重，在输出被软最大化之前乘以每个输出。因此每个输出的权重为 1。但我不断收
android - 线性布局中的 ImageView 权重
我有这样的布局: 我希望它看起来像: TextView - 宽度的 40%，带 ImageView 的布局
安卓布局。权重、 ScrollView 、 ListView
这让我彻底疯了。我想在 android 中使用有点复杂的布局。我正在尝试使用权重而不是固定事物的大小。也许我应该放弃…… 这是我想做的: 我想要 3 个 ScrollView (里面有 TextVie
android - 以编程方式 LinearLayout 权重
我正在尝试开发类似于网格但使用 LinearLayout。我想在单行中有 3 张图像和图像后的确切底部文本。我尝试过的: LinearLayout layout = new LinearLayout
Android LinearLayout RelativeLayout 权重
我想在同一行添加一个 EditText 和一个 Button，我想将 80% 的行给 editText，20% 给 Button。这是我的代码:
PHP 权重 SQL 结果
我有一个 mysql 表，其中存储一列(称为 tickets)，并且 tickets 值可以是任意数字。我想要做的是有一个mysql查询，从列中选择所有行，按降序对它们进行排序，然后使用PHP对查询
mysql - 在MySQL中以一定的机会(权重)选择随机行
我搜索了一段时间，但结果让我很困惑，因为我对 MySQL 还很陌生。我有一个包含这 4 列的表:AUTO_INCREMENT ID、NAME、TYPE、CHANCE 所以行看起来像这样: 1, NO
javascript - 减少重复函数的 JavaScript 权重
我不完全是 JS 专业人士，虽然不漂亮或高效，但这是有效的。实际上，我在表单中有重复的字段组，并允许用户根据需要将数据从第一个字段复制到所有 5 个字段。如何使这段代码更高效？ function
python - 检索和修改 XGBoost 权重
我正在使用xgboost库来训练二元分类器。我想通过向权重添加噪声(例如集合中树的叶节点的值)来防止训练算法的数据泄漏。为此，我需要检索每棵树的权重并修改它们。我可以通过在 Booster 对象上使
android - 如何设置 View 权重？
我正在尝试让 LinearLayout 中的 View 填充宽度。我尝试使用 LayoutParams 设置它，但它给了我一个错误: 我的代码: EditText et = new EditText(
android - 以编程方式更改 ScrollView 权重
我想改变 ScrollView 的权重，但找不到实现它的方法。这是我的 XML: **other layout.. 从代码中只能设置scrollView的高度或者宽度，weigh

首页

博学

6Ren·AI

商城

python - 有效地向模型中的所有可训练权重添加噪声