- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试在训练期间的每个时期之后进行验证。
我正在创建如下图表:
import tensorflow as tf
from networks import densenet
from networks.densenet_utils import dense_arg_scope
with tf.variable_scope('scope') as scope:
with slim.arg_scope(dense_arg_scope()):
logits_train, _ = densenet(images, blocks=networks[
'densenet_265'], num_classes=1000, data_name='imagenet', is_training=True, scope='densenet265',
reuse=tf.AUTO_REUSE)
scope.reuse_variables()
with slim.arg_scope(dense_arg_scope()):
logits_val, _ = densenet(images, blocks=networks[
'densenet_265'], num_classes=1000, data_name='imagenet', is_training=False, scope='densenet265',
reuse=tf.AUTO_REUSE)
为了在训练或验证期间获得 logits
,我执行以下操作:
is_training = tf.Variable(True, trainable=False, dtype=tf.bool)
training_mode = tf.assign(is_training, True)
validation_mode = tf.assign(is_training, False)
logits = tf.cond(tf.equal(is_training, tf.constant(True, dtype=tf.bool)), lambda: logits_train,
lambda: logits_val)
但是,当我运行我的代码时,出现 OOM 错误。我确信这不是因为批量大。这是因为,之前我犯了一个错误,在训练和验证期间使用了相同的图表。当时批处理大小为 32
,图像大小为 224x224x3
,代码运行良好。
我怀疑我在使用 is_training=False
验证期间尝试重用图表时犯了一些错误。
densenet 的代码取自以下两个文件: densenet_utils.py densenet.py
最佳答案
您在 logits_train 和 logits_val 中创建了两个独立的网络,因此这会占用您的网络原本占用的内存的两倍。 (我假设它设置正确并且变量共享正确,这可能是另一个问题,但这不太可能导致 OOM,大数据是激活,而不是权重。)
没有必要这样做。也使用相同的网络 logits_train
进行验证。事实证明,参数 is_training
也可以采用 bool 标量张量,因此您可以即时切换训练或推理模式。
所以就在您设置images
占位符的地方,将这一行作为下一行:
training_mode = tf.placeholder( shape = None, dtype = tf.bool )
然后在上面的代码中,像这样设置你的网络:
logits_train, _ = densenet(images, blocks=networks['densenet_265'],
num_classes=1000, data_name='imagenet', is_training=training_mode,
scope='densenet265', reuse=tf.AUTO_REUSE)
请注意,is_training
参数的值由上面的张量 training_mode
填充!
然后当您执行 sess.run( [ ... ] )
命令(在上面的代码中不可见)时,您应该在 training_mode
中包含 code>feed_dict
像这样(伪代码):
result = sess.run( [ ??? ], feed_dict = { images : ???, training_mode : True / False } )
请注意,training_mode
张量现在根据您是否正在进行训练填充为 False 或 True。
这是基于我对batch_normalization 和dropout 层的研究。
关于tensorflow - 这是在训练期间重用 tf.slim 图进行验证的正确方法吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49598717/
将已完成的 MPI_Request 重新用于另一个请求是否安全?我一直在使用 MPI_Request 池来提高性能并且没有错误。但肯定知道会很好。 最佳答案 MPI_Request 类型的变量不是请求
我注意到 Qt 文档在翻译的某些方面不是很冗长。我一直在玩弄它,试图通过反复试验来弄清楚他们的行为。最终目标是在运行时更改翻译,但我很困惑 QTranslator 对象在多大程度上可以重用。 考虑一下
我有一个 UIImageView 对象,它只是一个纯黑色矩形。这是我用来选择 View 中的按钮的方法。 问题是,我的 View 中有 49 个这样的按钮,并且所有这些按钮都可以同时选择。 我用来向按
在 R 中构建模型时,如何保存模型规范以便可以在新数据上重用它?假设我根据历史数据建立逻辑回归,但直到下个月才会有新的观察结果。最好的方法是什么? 我考虑过的事情: 保存模型对象并在新 session
我是 React/Redux 的初学者。 我已经完成了一个基本组件在我的应用程序中,其操作/ reducer /商店运行良好。 我将渲染另一个 具有不同的设置( Prop )。 我想做的是分离这两个组
我正在开发 GUI 纸牌游戏,我想知道是否有办法改进我的代码。这是我的情况。 我有三张牌:A、B 和 C。玩家可以通过分别单击三个按钮之一来更换牌:分别是按钮 1、按钮 2 或按钮 3。 class
每个文本框旁边有 2 个文本框和 2 个按钮 [...]。是否可以使用一个 OpenFileDialog 并将 FilePath 传递到相应的文本框,基于单击哪个按钮?即...如果我单击第一个按钮并打
我有两个场景:第一个场景,渲染纹理平面,第二个场景,应该渲染为纹理。该纹理应用作主场景中平面的贴图。 出于某种原因,所有 THREE.WebGLRenderTarget 示例每帧都会重新绘制两个场景,
我知道 concat、StringBuffer 和 StringBuilder 之间的区别。我知道 StringBuffer.toString 支持数组的内存问题可能会导致内存爆炸。我什至知道 JDK
我有 2 个 Activity 。 A 和 B。A 有一个包含 4 个项目的操作栏。每个项目显示不同的电影列表。 B extends A 因为我希望能够使用操作栏来更改电影列表。 所以我的问题是,当我
我有一个查询,用于检查从搜索文本框中输入的每个关键字,并且必须返回最匹配的关键字。 问题是,我想排除返回行中所有值为 0 的 KW_MATCHED。 SELECT A1.*, (
当方法重用时,是否有像这样的代码可以与 UICollectionViewCell 一起使用? - (UITableViewCell *)tableView:(UITableView *)tableVi
在我的项目中,我想在可 ScrollView 中以zig-zag 模式显示图像。所以我使用 uiscrollview 子查看其中的图像。它工作正常,但它占用了太多内存,因为我将所有图像加载到 Scro
如果我有 UIViewController1 并且我让它以模态方式显示 UIViewController2,但我希望 UIViewController2 显示 UIViewController1 模式
我想在所有 CCMenuItem 中使用完全相同的标签。如果我创建相同的 CCLabelTTF 一次,那么我无法将其添加到多个 CCMenuItem 中,因为它会给出有关已添加标签的运行时错误。但是,
我正在做一个项目,我们需要显示列表与用户位置的距离。为了显示距离,当在输入中给出纬度/经度时,我们使用名为“distance”的脚本字段计算距离 "script_fields" : {
我正在尝试重用我的 UITableViewCells。目前我的应用程序运行良好,在 tableView 中显示内容。然而,当我尝试实现 - 重用 UITableViewCells 时,我的应用程序崩溃
假设我在外部样式表中定义了几个类 .b {font-weight:bold;} .c {text-align:center;} 现在我想要另一个类,它是 b 和 c 的组合 .bc 是否可以使用类 b
我目前经常分配新的协程实例(请参阅我的回答中的代码 here)。 这样做的开销并不小。 我猜想是否有某种方法可以通过重用之前分配的协程来降低成本? 虽然不确定如何实现这一点? 我可以为协程 Alloc
在我的应用程序中,我使用如下代码下载多张图片。这样做是高性能还是我可以以某种方式重用连接? for(int i = 0; i < 100; i++){ URL url = new UR
我是一名优秀的程序员,十分优秀!