deep-learning - Tensorflow 不共享变量-6ren

deep-learning - Tensorflow 不共享变量

转载作者：行者123 更新时间：2023-12-03 00:39:44

25

4

我们修改了CIFAR-10 tutorial (卷积神经网络)在 Adience 数据库上运行，对面部进行性别分类。我们读here “参数共享”是有用的，因为假设一个补丁特征是有用的，无论图像中的位置如何。除外:

Note that sometimes the parameter sharing assumption may not make sense. This is especially the case when the input images to a ConvNet have some specific centered structure, where we should expect, for example, that completely different features should be learned on one side of the image than another. One practical example is when the input are faces that have been centered in the image.

目标:因此我们希望关闭 CNN 的参数共享。

代码

我认为 CIFAR-10 教程使用了参数共享？ def inference(images) 函数中的这部分代码似乎必须用它做一些事情:

biases = _variable_on_cpu('biases', [64], tf.constant_initializer(0.0))
bias = tf.nn.bias_add(conv, biases)

哪个调用:

def _variable_on_cpu(name, shape, initializer):
    with tf.device('/cpu:0'):
        var = tf.get_variable(name, shape, initializer=initializer)
    return var

问题

CIFAR-10 教程中确实存在参数共享吗？
您能否告诉我们，我们是否正在寻找用于关闭参数共享的正确代码段，或者还需要寻找其他位置？
欢迎任何其他帮助/建议，因为我们不知道从哪里开始。

最佳答案

CIFAR-10 model本教程在前两层( 'conv1' 和 'conv2' )中使用“参数共享”。使用 tf.nn.conv2d() 暗示了共享。运算符，它有效地从输入图像中提取补丁，并对每个补丁应用相同的过滤器(即共享参数)。

当你有一组卷积层时，“关闭”参数共享并不是一件容易的事:相反，你必须用不同类型的层替换它们。最简单的改变可能是用全连接层替换卷积层，例如通过使用 tf.nn.relu_layer()(如 'local3' 和 'local4' 层)，它在内部执行矩阵乘法并为每个输入神经元维护单独的参数。

注意对于视觉任务，全连接层通常会过度参数化，更合适的中间立场是使用 "local receptive field" ，它(非正式地)为每个输入维护单独的参数(如在完全连接的层中)，但仅组合来自“附近”输入的值以产生输出(如在卷积中)。不幸的是，TensorFlow 尚未包含局部感受野的实现，但是adding support for them将是一个有用的项目。

关于deep-learning - Tensorflow 不共享变量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34858459/

25

4

0

文章推荐： ruby-on-rails - 如何编写一个 Rails 查询来按月返回计数？

文章推荐： javascript - 泄漏的原因是什么？

文章推荐： TensorFlow:NotFoundError:在检查点中找不到 key

css -/deep/::ng-deep 之间有什么区别？
你能告诉我，下面两种 scss 样式之间的区别吗？我对此没有清楚的认识。 :host { display: inline-block; /deep/ { span { co
css -/deep/OR::ng-deep 的长期替代方案是什么？
/deep/和::ng-deep 这些在 DOM 模式下也被弃用了，我想知道将来是否会有/deep/和::ng-deep 的替代方案，或者我们应该开始使用其他方式？ ::ng-deep .result
angular - 在不使用::ng-deep、/deep/或 >>> 组合器的情况下设置第三方组件样式的正确方法是什么？
长期以来，我一直在寻找这个问题的明确答案。是否有可靠且推荐的替代策略来执行此操作？此问题的不正确答案包括: Just favor ::ng-deep for now 和 if component au
deep-learning - 什么是更好的选择 : A wide neural network or a deep neural network?
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 2 年前。 Improve this qu
deep-learning - Deepmind Deep Q Network (DQN) 3D 卷积
我正在阅读 DQN 网络上的 deepmind 自然论文。我几乎得到了关于它的一切，除了一个。我不知道为什么以前没有人问过这个问题，但无论如何对我来说似乎有点奇怪。我的问题: DQN 的输入是一个
deep-linking - Jetpack 撰写 : Bottom bar navigation not responding after deep-linking
我在我的新 Jetpack Compose 应用程序中设置了一个底栏，其中包含 2 个目的地。我尝试遵循 Google 的示例。例如它看起来像这样: @Composable fun MyBottom
css - 如何在 Vue.js 中使用/deep/或 >>> 或::v-deep？
所以，我读过 here在 Vue.js 中，您可以在选择器中使用 /deep/ 或 >>> 来创建适用于子组件内部元素的样式规则。但是，尝试在我的样式中使用它，无论是在 SCSS 中还是在普通的旧 C
python - 为什么我的 Deep Q Net 和 Double Deep Q Net 不稳定？
我正在尝试实现DQN和DDQN(两者都有经验回复)来解决OpenAI AI-Gym Cartpole环境。这两种方法有时都能学习并解决这个问题，但并非总是如此。我的网络只是一个前馈网络(我尝试过使用
angular - :host::ng-deep .class 和 .class :host::ng-deep 之间的区别？
scss中下面两个有什么区别，在片段中给出一些例子。 :host::ng-deep .content-body { ... } 和 .content-body :host::ng-deep { ...
css - SonarQube -::ng-deep 收到错误为 "Unexpected unknown pseudo-element selector::ng-deep"
在我们的元素中，我们使用了 Angular Material 进行开发。我们已经覆盖了使用::ng-deep 的 Angular Material 样式自定义 CSS 属性。在使用::ng-dee
python - 为什么我的 Deep Q Network 没有掌握一个简单的 Gridworld (Tensorflow)？ (如何评估 Deep-Q-Net)
我尝试熟悉 Q-learning 和深度神经网络，目前尝试实现 Playing Atari with Deep Reinforcement Learning . 为了测试我的实现并尝试使用它，我坚持尝
css - 不推荐使用 Vue 3::v-deep 作为组合器。使用::v-deep() 代替
我开始在 Vue 3 中收到以下警告 ::v-deep用法。 ::v-deep usage as a combinator has been deprecated. Use ::v-deep() in
python Pandas DataFrame 复制(deep=False)vs 复制(deep=True)vs '='
谁能给我解释一下 df2 = df1 df2 = df1.copy() df3 = df1.copy(deep=False) 我已经尝试了所有选项并执行了以下操作: df1 = pd.DataFram
deep-learning - 如何在pytorch中正确使用分布式数据并行
我对 PyTorch 比较陌生，但我对 Keras 和 TensorFlow 有很好的经验。我关注了这个article在我自己的训练脚本中使用 DDP。然而，出于某种原因，我总是最终得到: proce
deep-learning - pytorch中的Dropconnect实现
我正在尝试为 Conv2D 和 transposeconv2D 层编写 dropconnect 代码。按照 https://pytorchnlp.readthedocs.io/en/latest/_m
deep-learning - yolov5输出的解读
我正在做一个 mask 检测项目，我使用 ultralytics/yolov5 训练了我的模型。我将训练好的模型保存为一个 onnx 文件，你可以在这里找到模型文件 model.onnx .现在我希望
deep-learning - 在健身房自定义环境中定义观察空间时出错
我正在研究一种强化算法，我对此很陌生，并试图掌握一些东西。 Player1Env 查看 7x6 Connect4 游戏网格。我按如下方式初始化类: def __init__(self): su
deep-learning - 简单的加权嵌入网络
我有几个嵌入矩阵，假设 E1 矩阵用于 Glove，E2 用于 Word2vec。我想构建一个简单的情感分类器，它采用该嵌入的可训练加权和。例如，对于单词“dog”，我想在学习 x 和 y 时得到
deep-learning - 我怎样才能摆脱深度学习中卡住的准确性和损失值？
我正在使用它处理深度学习和医学图像分类。我使用大脑 MRI 数据并将它们转换为 jpg。然后使用 VGG16 进行训练。当我检查损失、准确性、验证损失和验证准确性时，我看到了下图。 accuracy
deep-learning - 我们如何计算包含转置卷积层的网络的感受野？
我设计的网络包括转置卷积层。(pytorch 中的 ConvTranspose2d) 我想获得网络的感受野大小。感受野的概念是否也适用于转置卷积层？如果是，那我怎样才能得到它？最佳答案您可以使

首页

博学

6Ren·AI

商城

deep-learning - Tensorflow 不共享变量

代码

问题