- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这是具有标准损失函数的模型。
target = Input(shape=(1, ), dtype='int32')
w_inputs = Input(shape=(1, ), dtype='int32')
w_emb = Embedding(V, dim, embeddings_initializer='glorot_uniform',name='word_emb')(w_inputs)
w_flat= Flatten()(w_emb)
# context
w1= Dense(input_dim=dim, units=V, activation='softmax') # because I want to use predicition on valid set)
w= w1(w_flat)
model = Model(inputs=[w_inputs], outputs=[w])
model.compile(loss='sparse_categorical_crossentropy', optimizer='sgd',metrics=['accuracy'])
效果很好。鉴于 keras 中不提供 NCE 损失,我编写了一个自定义损失。
def model_loss(layer,labels, inputs, num_sampled, num_classes, num_true):
weights= K.transpose( layer.get_weights()[0])
biases = layer.get_weights()[1]
def loss(y_true, y_pred):
if K.learning_phase() == 1:
compute_loss = tf.nn.nce_loss(weights, biases, labels, inputs, num_sampled, num_classes, num_true,
partition_strategy="div")
else:
logits = tf.matmul(K.squeeze(inputs,axis=0), K.transpose(weights))
logits = tf.nn.bias_add(logits, biases)
labels_one_hot = tf.one_hot(labels, num_classes)
loss = tf.nn.sigmoid_cross_entropy_with_logits(
labels=labels_one_hot[:][0][:],
logits=logits)
compute_loss = tf.reduce_sum(loss, axis=1)
return compute_loss
return loss
并将最后一行更改为:
model.compile(loss=model_loss(w1,target, w_emb, num_sampled, num_classes, num_true), optimizer='sgd',metrics=['accuracy'])
顺便说一句,这可以编译。
并在执行时死亡。
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-68-d3b3ef93b81b> in <module>
3 epochs=epochs, steps_per_epoch = seq_len,
4
----> 5 verbose=1, max_queue_size=15)
/opt/conda/lib/python3.6/site-packages/keras/legacy/interfaces.py in wrapper(*args, **kwargs)
89 warnings.warn('Update your `' + object_name + '` call to the ' +
90 'Keras 2 API: ' + signature, stacklevel=2)
---> 91 return func(*args, **kwargs)
92 wrapper._original_function = func
93 return wrapper
/opt/conda/lib/python3.6/site-packages/keras/engine/training.py in fit_generator(self, generator, steps_per_epoch, epochs, verbose, callbacks, validation_data, validation_steps, class_weight, max_queue_size, workers, use_multiprocessing, shuffle, initial_epoch)
1416 use_multiprocessing=use_multiprocessing,
1417 shuffle=shuffle,
-> 1418 initial_epoch=initial_epoch)
1419
1420 @interfaces.legacy_generator_methods_support
/opt/conda/lib/python3.6/site-packages/keras/engine/training_generator.py in fit_generator(model, generator, steps_per_epoch, epochs, verbose, callbacks, validation_data, validation_steps, class_weight, max_queue_size, workers, use_multiprocessing, shuffle, initial_epoch)
38
39 do_validation = bool(validation_data)
---> 40 model._make_train_function()
41 if do_validation:
42 model._make_test_function()
/opt/conda/lib/python3.6/site-packages/keras/engine/training.py in _make_train_function(self)
507 training_updates = self.optimizer.get_updates(
508 params=self._collected_trainable_weights,
--> 509 loss=self.total_loss)
510 updates = (self.updates +
511 training_updates +
/opt/conda/lib/python3.6/site-packages/keras/legacy/interfaces.py in wrapper(*args, **kwargs)
89 warnings.warn('Update your `' + object_name + '` call to the ' +
90 'Keras 2 API: ' + signature, stacklevel=2)
---> 91 return func(*args, **kwargs)
92 wrapper._original_function = func
93 return wrapper
/opt/conda/lib/python3.6/site-packages/keras/optimizers.py in get_updates(self, loss, params)
182 @interfaces.legacy_get_updates_support
183 def get_updates(self, loss, params):
--> 184 grads = self.get_gradients(loss, params)
185 self.updates = [K.update_add(self.iterations, 1)]
186
/opt/conda/lib/python3.6/site-packages/keras/optimizers.py in get_gradients(self, loss, params)
89 grads = K.gradients(loss, params)
90 if None in grads:
---> 91 raise ValueError('An operation has `None` for gradient. '
92 'Please make sure that all of your ops have a '
93 'gradient defined (i.e. are differentiable). '
ValueError: An operation has `None` for gradient. Please make sure that all of your ops have a gradient defined (i.e. are differentiable). Common ops without gradient: K.argmax, K.round, K.eval.
问题当然是,层中的权重没有完全更新,因此是非梯度。如果不制作自定义图层,我该如何做到这一点?我尝试过这种方法,但我放弃了使用图层来测量 val_acc 之类的东西。
最佳答案
如果没有 Layer 的 API,你似乎无法在 Keras 中做到这一点。您可以使用自定义层尝试此解决方案:Keras NCE Implementation
关于tensorflow - 喀拉斯 : Using weights for NCE loss,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56859126/
我希望深入了解 LightFM 实现的以下权重: 样本权重 什么是sample_weights在 fit方法?我读到它们是为了模拟时间衰减,但这究竟是如何工作的?解释这一点的示例或文章将非常有帮助。
如果这是一个愚蠢的问题,我预先道歉。 当调用 nw:weighted-path-to 时,会返回一个链接列表,描述起始海龟和目标海龟之间的最短路径。 类似地,调用 nw:turtles-on-weig
我阅读了以下代码: //talkback.c -- nosy, informative program #include #include //for strlen() prototype #d
我有这个示例 html 文件: Test font bold (weight = 700) Test font bold (weight = 900) 我不知道为什么如果我将
您好,我正在为我自己的数据集训练 VGG16 网络。下面给出了我使用的代码。 from keras.models import Sequential from scipy.misc import im
我刚看完the notes CNN 上的斯坦福 CS231n 和现场链接 demo ;然而,我不确定演示中的“激活”、“激活梯度”、“权重”和“权重梯度”指的是什么。 以下屏幕截图已从演示中复制。 混
我不明白 maxout 是如何工作的,我怀疑这是由于我对线性代数乘法的可视化造成的。基本上,我的印象是 maxout 函数有两组权重,均经过单独训练,然后只选择一组。但我怀疑这可能是错误的,因为我没有
我运行了 Tensorflow 1.0 提供的 ptb_word_lm.py,但它显示了这条消息: ValueError: Attempt to have a second RNNCell use t
我有一个关于 R 中的样本函数的简单问题。我从长度为 5 的输入向量中随机抽样 0 和 1 并将它们相加,该向量指定要运行的试验次数并设置种子以生成可重复的随机数字。种子按预期工作,但根据我在 pro
我有一个以“h5”格式保存的模型。在使用 编译模型后,我正在尝试恢复训练并尝试加载优化器的权重 model.optimizer.set_weights(weights_list) 哪里weights_
我正在尝试为我的大学项目开发电话分类器模型。我已经训练了我的模型,当我尝试通过执行 python app/server.pyserve 来部署模型时遇到了问题。我读了一篇文章( https://f
所以... var testArray=new Array("hello"); testArray.length=100; console.log(testArray.length); 我相信上面的内
在 css 规范中,什么会影响更多的 inline 样式或外部 !important 外部“style.css”: #di{color: green!important;} div 文本颜色是红色还
我正在使用 http://hughsk.github.io/colony/ 的调整后的代码,但我不断收到错误: Uncaught TypeError: Cannot read property 'we
我们有一个系统,它按表中的“优先级”编号处理记录。我们通过表的内容定义优先级,例如 UPDATE table SET priority=3 WHERE processed IS NULL UPDATE
我已经使用 Darkflow 和 yolov2.weights 进行了定制训练。 checkpoint 文件夹中有四个文件。它们是: 1.yolov2-3c-5500.data-00000-of-00
我需要将 weighted.mean 函数包含在另一个函数中,作为我正在处理的项目的一部分。我无法让 w 参数在我正在处理的函数中正常工作。 为了使我的整体功能正常工作,我需要满足使权重参数必须是可选
我想使用 ggplot 绘制加权 CDF。一些旧的非 SO 讨论(例如 2012 年的 this)表明这是不可能的,但我想我会重新加注。 例如,考虑以下数据: df <- data.frame(x=s
这个问题已经有答案了: 已关闭11 年前。 Possible Duplicate: In Java, what is the best way to determine the size of an
我需要将 weighted.mean 函数包含在另一个函数中,作为我正在处理的项目的一部分。我无法让 w 参数在我正在处理的函数中正常工作。 为了使我的整体功能正常工作,我需要满足使权重参数必须是可选
我是一名优秀的程序员,十分优秀!