python - Keras SimpleRNN/LSTM 默认使用哪个轴作为时间轴？-6ren

python - Keras SimpleRNN/LSTM 默认使用哪个轴作为时间轴？

转载作者：行者123 更新时间：2023-12-01 13:10:14

26

4

当使用 SimpleRNN 或 LSTM 进行经典处理时 sentiment analysis算法(此处适用于长度 <= 250 个单词/标记的句子):

model = Sequential()
model.add(Embedding(5000, 32, input_length=250))   # Output shape: (None, 250, 32)
model.add(SimpleRNN(100))                          # Output shape: (None, 100)
model.add(Dense(1, activation='sigmoid'))          # Output shape: (None, 1)

哪里指定了RNN输入的哪个轴作为“时间”轴？

更准确地说，在 Embedding 层之后，给定的输入句子，例如“the cat sat on the mat”，被编码为形状为 (250, 32) 的矩阵 x，其中 250 是输入的最大长度(以字为单位)文本和 32 嵌入的维度。然后，在 Keras 的哪个位置指定是否使用它:

h[t] = 激活(W_h * x[:, t] + U_h * h[t-1] + b_h )

或者这个:

h[t] = 激活(W_h * x[t, :] + U_h * h[t-1] + b_h)

(在这两种情况下，y[t] = activation( W_y * h[t] + b_y ))

TL;DR:如果 RNN Keras 层的输入大小为 (250, 32)，默认情况下它使用哪个轴作为时间轴？ Keras 或 Tensorflow 文档中的何处对此进行了详细说明？

PS:如何解释参数个数(由model.summary()给出)是13300？ W_h 有 100x32 系数，U_h 有 100x100 系数，b_h 有 100x1 系数，即我们已经有 13300! W_y 和 b_y 没有系数了!怎么解释呢？

最佳答案

时间轴:一直为dim 1，除非time_major=True，否则为dim 2； Embedding 层输出一个 3D 张量。这个可以看here其中 step_input_shape 是 recurrent loop 中每一步输入到 RNN cell 的形状.对于您的情况，timesteps=250，并且 SimpleRNN 单元在每一步“看到”一个形状为 (batch_size, 32) 的张量。

# of params:您可以通过检查每一层的 .build() 代码来了解图形的派生方式:Embedding , SimpleRNN , Dense ，或者同样在每一层上调用 .weights。对于您的情况，w/l = model.layers[1]:

l.weights[0].shape == (32, 100) --> 3200 个参数(内核)
l.weights[1].shape == (100, 100) --> 10000 个参数 (recurrent_kernel)
l.weights[2].shape == (100,) --> 100 个参数 (bias) (sum: 13,300 )

计算逻辑:没有W_y和b_y； “y”是隐藏状态，h，实际上适用于所有循环层 - 您引用的内容可能来自通用 RNN 公式。 @“在这两种情况下……”——这是错误的；要查看实际发生的情况，请检查 .call()代码。

附言我建议定义模型的完整 batch_shape 以进行调试，因为它消除了模棱两可的 None 形状

SimpleRNN 公式与代码:根据要求；请注意源代码中的 h 具有误导性，在公式(“预激活”)中通常为 z。

return_sequences=True -> 返回所有时间步的输出:(batch_size, timesteps, channels)
return_sequences=False -> 仅返回最后时间步的输出:(batch_size, 1, channels)。参见 here

关于python - Keras SimpleRNN/LSTM 默认使用哪个轴作为时间轴？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60571934/

26

4

0

文章推荐： java - 如何循环case of语句？

文章推荐： java - 找到正确的下载 javax.media.jai

文章推荐： java - 将外部 .exe 嵌入到 Maven 项目中的 .jar 文件中

文章推荐：正则表达式 - 在整个字符串中查找多个破折号......还有更多

时间轴、流程类时间轴绘制
目录效果图思路具体实现步骤一：ItemView顶部偏移步骤二：绘制圆和线条注意：下标的获取流程类的绘制
javascript - 时间轴 - 下一个和上一个事件
我正在尝试构建一个时间轴，但是当我点击其中一个圆圈时我无法实现该功能事件的绿色条已完成，或者如果我点击前一个圆圈则“禁用”，我的代码 CodePen 我尝试过的 Toggle var compl
JavaFx 时间轴 - 设置初始延迟
我最近开始使用 JavaFx 2.0，也许我的问题很基本，但目前我不知道如何解决它。例如，假设我有一个名为 Clock 的小型演示应用程序: import javafx.animation.KeyFr
javascript - HTML5 时间轴、甘特图控件
我需要创建一个基于自定义 HTML5 的控件，该控件是时间线和甘特图之间的交叉: 但是，我无法获得市场上已有的第三方控件来减少一些开发时间。它需要在顶部有微型缩小的时间轴以进行快速导航，滚动时会更新主
perl - 推特 LED 时间轴
你好，我已经为 twitter 时间线编写了一个脚本，除了我不知道如何授权我的 twitter api key ，我的 led 标志只是说“错误的身份验证数据” 这是我的代码 #!/usr/bin/p
javascript - D3 时间轴 - 为什么默认情况下刻度线似乎不可见？
我正在使用 X 时间轴绘制一个非常规则的图表。轴代码非常标准: var xScale = d3.time.scale() .domain([tlState.startd
java - 将多张照片发布到 Facebook 时间轴
谁能帮我解释一下如何使用图形 api 发布带有照片(不是一张照片)的状态；我尝试将照片添加到 me/photos 但我不需要查看以前帖子中的照片。当我使用类似 TIMELINE_ALBUM/pho
jquery - 格式化 jquery 时间轴？
我正在使用来自 here 的时间轴插件这是我当前的代码: 1940s 1950s 1960s 1970s 1980s 1990s 2000s 1940's Ronald. 1950's
javascript - 用于显示事件的日历(时间轴)小部件
我有一些事件:有些是连续的，有些只是一天的事件。我想在网页上精美地展示它们。有一堆日期选择器 jQuery 插件，但我找不到任何用于显示事件的插件。可以是canvas，也可以是svg，也可以是cs
html - 带有连接线的响应式 CSS 时间轴
我正在尝试创建一个响应式时间轴，它的行为类似于 ( https://codepen.io/anon/pen/KoGdqG): 对于大于 600px 的宽度是水平的。每个部分的宽度是响应式的；对于小于
jquery - 带有图像的 Bootstrap 时间轴
在我复制并粘贴来自 https://mdbootstrap.com/plugins/jquery/timeline/#images 的代码之后，为什么图像看起来很大，我该怎么做才能使左侧和右侧的内容变
android - 如何处理垂直 RecyclerView 时间轴？
我想创建一个垂直的动态时间轴，左边是发生的时间，右边是发生的事情，中间有一条线，每个事件的线上都有一个气泡。时间、事件和事件数量将是动态的。我在这里想的可能是垂直线的静态图像上的 RecyclerV
swiftui - 想要为延时(时间轴)重新创建以下 UI
我正在尝试重新创建以下内容: 我有以下代码，其中包含它的要点，但不是确切的外观和感觉，我仍在尝试掌握 Swift 的 UI 方面。 VStack(spacing: 30) {
javascript - AngularJS Google 图表 - 时间轴
在使用下面的代码使用 AngularJS 生成时间线图表时，我遇到了一个问题。基本上我无法找到导入时间线包的正确方法。就像下面导入 corechart 包一样，我如何导入时间线... google.
javascript - 设置 Twitter 时间轴 href
我正在尝试使用 javascript 或 jquery 在我的 Twitter 时间轴上动态设置 href 字段，我该如何执行此操作？ Tweets by me 最佳答案使用setAttribut
tensorflow - 如何在 Tensorflow 中读取跟踪文件(时间轴)
时间轴跟踪文件介绍如下: https://www.tensorflow.org/versions/r1.1/performance/xla/jit 这对于性能分析似乎很有用。但有一点我不明白。 1、“
csv - D3 时间轴 CSV 数据
我正在使用 d3 Timeline 插件 ( https://github.com/jiahuang/d3-timeline )，我终于得到了可视化可以读取我的数据的地方。但是，我现在需要使特定学生的
javascript - 谷歌图表 - 时间轴 : Scaling Axis
我正在尝试使用 Google 的时间轴创建一个图表来显示过去 7 天的事件，但我在缩放 x 轴时遇到了问题。图表总是试图根据数据自动缩放，这破坏了我想要合并的一致性。我希望图表的右侧是今天的日期，左
jquery - Google map 时间轴 slider
获取多个 KML 文件(每个文件代表不同的日期)并创建带有 slider 的 Google map 的最佳方法是什么？最佳答案尝试http://code.google.com/p/timemap/
jquery - CSS/Jquery 时间轴/调度程序显示
我一直在尝试为预定的事件构建一个网络显示。每个事件都有一个动态计算的宽度(基于事件持续时间)和 margin-left(基于开始时间)。每个事件也有一个高度，基于需要显示的内容。如果没有重叠事件将元素

首页

博学

6Ren·AI

商城

python - Keras SimpleRNN/LSTM 默认使用哪个轴作为时间轴？