tensorflow - tf.layers.conv2d 和 tf.layers.dense 中的默认内核初始值设定项是什么？-6ren

tensorflow - tf.layers.conv2d 和 tf.layers.dense 中的默认内核初始值设定项是什么？

转载作者：行者123 更新时间：2023-12-03 05:32:31

26

4

官方 Tensorflow API 文档声称，对于 tf.layers.conv2d 和 tf.layers，参数 kernel_initializer 默认为 None .密集.

但是，在阅读图层教程( https://www.tensorflow.org/tutorials/layers )时，我注意到代码中未设置此参数。例如:

# Convolutional Layer #1
conv1 = tf.layers.conv2d(
    inputs=input_layer,
    filters=32,
    kernel_size=[5, 5],
    padding="same",
    activation=tf.nn.relu)

教程中的示例代码运行时没有任何错误，因此我认为默认的 kernel_initializer 不是 None。那么，使用哪个初始化器？

在另一个代码中，我没有设置 conv2d 和密集层的 kernel_initializer ，一切都很好。但是，当我尝试将 kernel_initializer 设置为 tf.truncated_normal_initializer(stddev=0.1, dtype=tf.float32) 时，出现 NaN 错误。这里发生了什么？有人可以帮忙吗？

最佳答案

问得好!找出来真是一个技巧!

如您所见，它没有记录在 tf.layers.conv2d 中
如果你看看 the function 的定义您会看到该函数调用 variable_scope.get_variable:

在代码中:

self.kernel = vs.get_variable('kernel',
                                  shape=kernel_shape,
                                  initializer=self.kernel_initializer,
                                  regularizer=self.kernel_regularizer,
                                  trainable=True,
                                  dtype=self.dtype)

下一步:what does the variable scope do when the initializer is None?

这里说:

If initializer is None (the default), the default initializer passed in the constructor is used. If that one is None too, we use a new glorot_uniform_initializer.

所以答案是:它使用 glorot_uniform_initializer

为了完整起见，此初始值设定项的定义:

The Glorot uniform initializer, also called Xavier uniform initializer. It draws samples from a uniform distribution within [-limit, limit] where limit is sqrt(6 / (fan_in + fan_out)) where fan_in is the number of input units in the weight tensor and fan_out is the number of output units in the weight tensor. Reference: http://jmlr.org/proceedings/papers/v9/glorot10a/glorot10a.pdf

编辑:这是我在代码和文档中找到的内容。也许您可以通过对权重运行 eval 来验证初始化是否像这样!

关于tensorflow - tf.layers.conv2d 和 tf.layers.dense 中的默认内核初始值设定项是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43284047/

26

4

0

文章推荐： vb.net - VB 中的空检查

xamarin - MvxSpinner 初始值
我有一个 MvvmCross MvxSpinner在 Android 中绑定(bind)。用户选择一个值并反射(reflect)在我的属性 MealTypeSelected . 微调器允许用户选择膳
delphi - 函数指针 - 初始值
我有一个带有某种类型函数指针的公共(public)变量的表单，如下所示: {...} interface type TExternalFunction = function(var x : TAn
ios - UIStepper 初始值
this question中的答案对我理解如何在 IBAction 方法中检索步进器值很有帮助(我投了赞成票)，但我仍然不理解在我第一次加载 View 时如何获取步进器的初始值。我想将初始值设置为
Swift 属性观察者，初始值
Apple 文档指出: The willSet and didSet observers of superclass properties are called when a property is
cfloop 中未指定索引时当前行的 ColdFusion 初始值
我正在将 ColdFusion 应用程序转换为 C#(我是 CF n00b)。我有一个脚本执行 cfquery，然后执行 cfloop 的结果，它似乎试图将当前行与其下一行进行比较。它似乎试图确保它
javascript - ANTD 动态表单 - 初始值
我在为 antd 动态表单设置初始值时遇到问题。有什么方法可以在动态中初始化值吗？它需要使用 getFieldDecorator 注册字段。但对于动态字段，该字段之前没有注册。我收到这个错误:不能在
Django - forms.FileField() 初始值
是否可以动态地为 forms.FileField() 赋予初始值？最佳答案我不确定，如果这就是你想要的，但是…… 显然，您不能为文件输入设置初始数据(这意味着您将文件发送给用户)。 Django
python - 表单中的django DateTimeField(初始值)
我对 Django 表单中 DateTimeField 的初始值没有什么问题。我在 forms.py 中有声明 class FaultForm(forms.ModelForm): ...
swift - 如何在swift中设置 slider 初始值？
如何使用代码设置 slider 初始值？我知道如何在属性检查器中执行此操作。我想在我的应用程序启动时使用“UserDefault”作为初始值，当我的应用程序第一次启动时，我想将初始值设置为“1.0”
WPF OneWayToSource 绑定(bind)初始值
我有一个 RadioButton其 IsChecked 的元素属性绑定(bind)到 MyProperty在 ViewModel . Binding有模式OneWayToSource由于某些原因，它会
android - LiveData “pass-by-reference”初始值
我有一个ViewModel类，看起来像这样: class EditUserViewModel( private val initUser: User, ) : ViewModel() {
swift - 限制在 Swift 语言的文本字段中输入某些第一个/初始值
有人可以帮我解决我的问题吗，问题是我希望我输入到文本字段的第一个初始值只是从 1 到 9 的数字，我正在使用小数垫，所以我也不希望我的初始值是小数点，但在第一个值(仅从 1 t0 9 开始的数字)之后
swift - FetchedResultsController 值不会覆盖自定义 NSManagedObject 初始值
我正在使用 NSFetchedResultsController 从 CoreData 获取数据并加载包含四个部分的 TableView 。当应用程序第一次运行时，它可以完美地工作，将 plist 加
react 形式的 Angular PrimeNG 下拉组件 - 初始值
使用 primeNg 下拉组件，我试图用初始值初始化下拉列表，但没有成功，我使用的是响应式(Reactive)方法。我检查了 primeNg 文档和演示 - 几乎所有示例都使用模板驱动，我希望模型驱
asp.net - 数据绑定(bind)下拉列表 - 初始值
如何在 ASP.NET 中设置数据绑定(bind)下拉列表的初始值？例如，我想要这些值，但要显示的第一个值应该是 -- Select One ---，且值为空。最佳答案我想你想做的是这样的:
angular - 给 BehaviorSubject 初始值 - 值是一个 Observable
我知道我不能给 BehaviorSubject一个 Observable 值，但我需要一种方法来解决这个问题。在应用程序初始化时，我正在获取当前用户(如果存在)，我需要提供 BehaviorSubje
jquery-ui - AngularJs + JqueryUI slider 初始值
这是我在这里的第一篇文章，所以我希望它是全面的。我正在使用 AngularJs，并且我使用 Angular 指令添加了一个 JqueryUI slider 。我找到了很多关于如何做到这一点的例子，但
c# - 如何有效地为 C# 中的大型数组分配一个公共(public)初始值？
如何有效地为大型数组分配一个公共(public)初始值？例如，如果我有一个 100 x 100 x 100 的整数数组，其中所有初始值都应为零。在 matlab 中我会简单地写: array = z
ios - 从 iOS 应用程序发送新值时始终获取 AppSync 初始值
我正在为 iOS 应用程序创建一个 Pebble 配套应用程序。我已经使用一些初始值设置了我的 AppSync: Tuplet initial_values[] = { TupletC
javascript - 每次重新渲染时都会计算 useState 和 useRef 初始值
有件事我迟到了: const [object, setObject] = useState(new SomeObject()); 在这里，我们在每次重新渲染上构造一个SomeObject实例。然后，如

首页

博学

6Ren·AI

商城

tensorflow - tf.layers.conv2d 和 tf.layers.dense 中的默认内核初始值设定项是什么？