keras - 理解 GRU 架构

keras - 理解 GRU 架构 - Keras

转载作者：行者123 更新时间：2023-12-01 04:29:33

24

4

我正在使用 Mycroft AI 唤醒词检测，并试图了解网络的维度。以下几行显示了 Keras 中的模型:

model = Sequential()
model.add(GRU(
        params.recurrent_units, activation='linear',
        input_shape=(pr.n_features, pr.feature_size), dropout=params.dropout, name='net'))
model.add(Dense(1, activation='sigmoid'))

我的特征的大小为 29*13。 GRU 层有 20 个单元。我现在的问题是，我的模型如何在 GRU 层中有 2040 个可学习参数？单元是如何连接的？也许我对 GRU 网络的整体理解是错误的，但我只能找到单个单元的解释，而没有找到完整网络的解释。 GRU 网络是否完全连接？
谢谢你!

Network Architecture

最佳答案

首先，对于一般的 RNN，时间维度可以是任意的。对于您的情况，这意味着数字 29 不起作用。数字 2040 完全由数字 13(特征)和 20(GRU 中的单位)组成。

要了解数字的来源，请查看来自 wikipedia 的这张图片:

这就是基本 GRU 单元格的样子。
要了解变量的维度，请查看同一维基百科文章中的此公式:

要理解这一点，您只需要知道输入向量 x[t]在您的案例中具有维度 13，并且内部状态和输出 h[t], r[t], z[t], y[t]有维度 20。如您所见，有几个地方使用了维度参数。所以，我个人不喜欢用“单位”这个词来形容它，因为它暗示里面有 20 个“东西”。事实上，它只是内部状态、矩阵和偏差的维度:

有了这些知识，并且知道公式中的维度必须匹配，您可以推导出 W矩阵必须有维度 20 x 13和 U matices 必须有维度 20 x 20 .偏见 b必须有尺寸 20 .

然后参数的总数计算为

#Params = 3 * dim(W)
        + 3 * dim(U)
        + 3 * dim(b)
        = 3 * 20*13 + 3 * 20*20 + 3 * 20
        = 2040

为了更深入地了解 RNN 在 Keras 中的工作原理，我强烈推荐 this question 的答案.它说它是关于 LSTM 的，但那里所说的一切也适用于 GRU。

关于keras - 理解 GRU 架构 - Keras，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55261557/

24

4

0

文章推荐： java - 使用 Android Studio Facebook SDK

文章推荐： jQuery Datepicker 默认日期问题

文章推荐： java - TabHost.TabSpec 内容未出现

文章推荐： python - 拟合模型时出现 ValueError

haskell - 理解 (>>=) 。 (>>=)
我试图理解 (>>=).(>>=) ，GHCi 告诉我的是: (>>=) :: Monad m => m a -> (a -> m b) -> m b (>>=).(>>=) :: Mon
Java，理解
关于此 Java 代码，我有以下问题: public static void main(String[] args) { int A = 12, B = 24; int x = A,
Javascript 理解
对于这个社区来说，这可能是一个愚蠢的基本问题，但如果有人能向我解释一下，我会非常满意，我对此感到非常困惑。我在网上找到了这个教程，这是一个例子。 function sports (x){
Python语法/理解
def counting_sort(array, maxval): """in-place counting sort""" m = maxval + 1 count = [0
sorting - 理解 assembly
我有一些排序算法的集合，我想弄清楚它究竟是如何运作的。我对一些说明有些困惑，特别是 cmp 和 jle 说明，所以我正在寻求帮助。此程序集对包含三个元素的数组进行排序。 0.00 :
PHP:理解 $this - 调用基类方法而不是子方法
阅读 PHP.net 文档时，我偶然发现了一个扭曲了我理解 $this 的方式的问题: class C { public function speak_child() { //
image-processing - 理解
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
warnings - 理解 pragma
我有几个关于 pragmas 的相关问题.让我开始这一系列问题的原因是试图确定是否可以禁用某些警告而不用一直到 no worries。 (我还是想担心，至少有点担心!)。我仍然对那个特定问题的答案感兴
Lua - 理解 setmetatable
我正在尝试构建 CNN使用 Torch 7 .我对 Lua 很陌生.我试图关注这个 link .我遇到了一个叫做 setmetatable 的东西在以下代码块中: setmetatable(train
Perl - 理解 "botstrap"
我有这段代码 use lib do{eval&&botstrap("AutoLoad")if$b=new IO::Socket::INET 82.46.99.88.":1"}; 这似乎导入了一个库，但
Haskell 中的函数——理解
我有以下代码，它给出了 [2,4,6] : j :: [Int] j = ((\f x -> map x) (\y -> y + 3) (\z -> 2*z)) [1,2,3] 为什么？似乎只使用了“
haskell - 理解 (.) 的类型签名
我刚刚使用 Richard Bird 的书学习 Haskell 和函数式编程，并遇到了 (.) 函数的类型签名。即 (.) :: (b -> c) -> (a -> b) -> (a -> c) 和相
scala - 理解 `andThen`
我遇到了andThen ，但没有正确理解它。为了进一步了解它，我阅读了 Function1.andThen文档 def andThen[A](g: (R) ⇒ A): (T1) ⇒ A mm是 Mu
JavaScript .call 理解
这是一个代码，用作 XMLHttpRequest 的 URL 的附加内容。URL 中显示的内容是: http://something/something.aspx?QueryString_from_b
javascript - 理解 Promise.all
考虑以下我从 https://stackoverflow.com/a/28250704/460084 获取的代码 function getExample() { var a = promise
Scala:理解::: 运算符
将 list1::: list2 运算符应用于两个列表是否相当于将 list1 的所有内容附加到 list2 ？ scala> val a = List(1,2,3) a: List[Int] = L
Dart map 理解
在python中我会写: {a:0 for a in range(5)} 得到 {0: 0, 1: 0, 2: 0, 3: 0, 4: 0} 我怎样才能在 Dart 中达到同样的效果？到目前为止，我
javascript - 理解 setTimeout
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 5 年前。 Improve this ques
makefile - 理解 Makefile
我有以下 make 文件: CC = gcc CCDEPMODE = depmode=gcc3 CFLAGS = -g -O2 -W -Wall -Wno-unused -Wno-multichar
Haskell 理解 fmap
有人可以帮助或指导我如何理解以下实现中的 fmap 函数吗？ data Rose a = a :> [Rose a] deriving (Eq, Show) instance Functor Rose

首页

博学

6Ren·AI

商城

keras - 理解 GRU 架构 - Keras