- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
当使用 SimpleRNN
或 LSTM
进行经典处理时 sentiment analysis算法(此处适用于长度 <= 250 个单词/标记的句子):
model = Sequential()
model.add(Embedding(5000, 32, input_length=250)) # Output shape: (None, 250, 32)
model.add(SimpleRNN(100)) # Output shape: (None, 100)
model.add(Dense(1, activation='sigmoid')) # Output shape: (None, 1)
哪里指定了RNN输入的哪个轴作为“时间”轴?
更准确地说,在 Embedding
层之后,给定的输入句子,例如“the cat sat on the mat”,被编码为形状为 (250, 32) 的矩阵 x
,其中 250 是输入的最大长度(以字为单位)文本和 32 嵌入的维度。然后,在 Keras 的哪个位置指定是否使用它:
h[t] = 激活(W_h * x[:, t] + U_h * h[t-1] + b_h )
或者这个:
h[t] = 激活(W_h * x[t, :] + U_h * h[t-1] + b_h)
(在这两种情况下,y[t] = activation( W_y * h[t] + b_y )
)
TL;DR:如果 RNN Keras 层的输入大小为 (250, 32),默认情况下它使用哪个轴作为时间轴? Keras 或 Tensorflow 文档中的何处对此进行了详细说明?
PS:如何解释参数个数(由model.summary()
给出)是13300? W_h
有 100x32 系数,U_h
有 100x100 系数,b_h
有 100x1 系数,即我们已经有 13300! W_y
和 b_y
没有系数了!怎么解释呢?
最佳答案
时间轴:一直为dim 1,除非time_major=True
,否则为dim 2; Embedding
层输出一个 3D 张量。这个可以看here其中 step_input_shape
是 recurrent loop 中每一步输入到 RNN cell
的形状.对于您的情况,timesteps=250
,并且 SimpleRNN 单元在每一步“看到”一个形状为 (batch_size, 32)
的张量。
# of params:您可以通过检查每一层的 .build()
代码来了解图形的派生方式:Embedding , SimpleRNN , Dense ,或者同样在每一层上调用 .weights
。对于您的情况,w/l = model.layers[1]
:
l.weights[0].shape == (32, 100)
--> 3200 个参数(内核
)l.weights[1].shape == (100, 100)
--> 10000 个参数 (recurrent_kernel
)l.weights[2].shape == (100,)
--> 100 个参数 (bias
) (sum: 13,300 )计算逻辑:没有W_y
和b_y
; “y”是隐藏状态,h
,实际上适用于所有循环层 - 您引用的内容可能来自通用 RNN 公式。 @“在这两种情况下……”——这是错误的;要查看实际发生的情况,请检查 .call()
代码。
附言我建议定义模型的完整 batch_shape
以进行调试,因为它消除了模棱两可的 None
形状
SimpleRNN 公式与代码:根据要求;请注意源代码中的 h
具有误导性,在公式(“预激活”)中通常为 z
。
return_sequences=True
-> 返回所有时间步的输出:(batch_size, timesteps, channels)
return_sequences=False
-> 仅返回最后时间步的输出:(batch_size, 1, channels)
。参见 here
关于python - Keras SimpleRNN/LSTM 默认使用哪个轴作为时间轴?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60571934/
目录 效果图 思路 具体实现 步骤一:ItemView顶部偏移 步骤二:绘制圆和线条 注意:下标的获取 流程类的绘制
我正在尝试构建一个时间轴,但是当我点击其中一个圆圈时我无法实现该功能事件的绿色条已完成,或者如果我点击前一个圆圈则“禁用”, 我的代码 CodePen 我尝试过的 Toggle var compl
我最近开始使用 JavaFx 2.0,也许我的问题很基本,但目前我不知道如何解决它。例如,假设我有一个名为 Clock 的小型演示应用程序: import javafx.animation.KeyFr
我需要创建一个基于自定义 HTML5 的控件,该控件是时间线和甘特图之间的交叉: 但是,我无法获得市场上已有的第三方控件来减少一些开发时间。它需要在顶部有微型缩小的时间轴以进行快速导航,滚动时会更新主
你好,我已经为 twitter 时间线编写了一个脚本,除了我不知道如何授权我的 twitter api key ,我的 led 标志只是说“错误的身份验证数据” 这是我的代码 #!/usr/bin/p
我正在使用 X 时间轴绘制一个非常规则的图表。轴代码非常标准: var xScale = d3.time.scale() .domain([tlState.startd
谁能帮我解释一下如何使用图形 api 发布带有照片(不是一张照片)的状态; 我尝试将照片添加到 me/photos 但我不需要查看以前帖子中的照片。 当我使用类似 TIMELINE_ALBUM/pho
我正在使用来自 here 的时间轴插件 这是我当前的代码: 1940s 1950s 1960s 1970s 1980s 1990s 2000s 1940's Ronald. 1950's
我有一些事件:有些是连续的,有些只是一天的事件。 我想在网页上精美地展示它们。有一堆日期选择器 jQuery 插件,但我找不到任何用于显示事件的插件。 可以是canvas,也可以是svg,也可以是cs
我正在尝试创建一个响应式时间轴,它的行为类似于 ( https://codepen.io/anon/pen/KoGdqG): 对于大于 600px 的宽度是水平的。每个部分的宽度是响应式的; 对于小于
在我复制并粘贴来自 https://mdbootstrap.com/plugins/jquery/timeline/#images 的代码之后,为什么图像看起来很大,我该怎么做才能使左侧和右侧的内容变
我想创建一个垂直的动态时间轴,左边是发生的时间,右边是发生的事情,中间有一条线,每个事件的线上都有一个气泡。时间、事件和事件数量将是动态的。 我在这里想的可能是垂直线的静态图像上的 RecyclerV
我正在尝试重新创建以下内容: 我有以下代码,其中包含它的要点,但不是确切的外观和感觉,我仍在尝试掌握 Swift 的 UI 方面。 VStack(spacing: 30) {
在使用下面的代码使用 AngularJS 生成时间线图表时,我遇到了一个问题。 基本上我无法找到导入时间线包的正确方法。就像下面导入 corechart 包一样,我如何导入时间线... google.
我正在尝试使用 javascript 或 jquery 在我的 Twitter 时间轴上动态设置 href 字段,我该如何执行此操作? Tweets by me 最佳答案 使用setAttribut
时间轴跟踪文件介绍如下: https://www.tensorflow.org/versions/r1.1/performance/xla/jit 这对于性能分析似乎很有用。但有一点我不明白。 1、“
我正在使用 d3 Timeline 插件 ( https://github.com/jiahuang/d3-timeline ),我终于得到了可视化可以读取我的数据的地方。但是,我现在需要使特定学生的
我正在尝试使用 Google 的时间轴创建一个图表来显示过去 7 天的事件,但我在缩放 x 轴时遇到了问题。 图表总是试图根据数据自动缩放,这破坏了我想要合并的一致性。我希望图表的右侧是今天的日期,左
获取多个 KML 文件(每个文件代表不同的日期)并创建带有 slider 的 Google map 的最佳方法是什么? 最佳答案 尝试http://code.google.com/p/timemap/
我一直在尝试为预定的事件构建一个网络显示。每个事件都有一个动态计算的宽度(基于事件持续时间)和 margin-left(基于开始时间)。每个事件也有一个高度,基于需要显示的内容。如果没有重叠事件将元素
我是一名优秀的程序员,十分优秀!