- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我最近在 Keras 中构建了一个 CNN(以 Tensorflow 作为后端),它将恒星光谱作为输入并预测三个恒星参数作为输出:温度、表面重力和金属度。我现在正在尝试创建一个执行相同操作的 RNN,以便比较这两个模型。
在搜索示例和论坛后,我还没有发现很多与我的项目足够相似的应用程序。我已经尝试实现一个简单的 RNN 以查看我是否可以得出合理的结果,但到目前为止运气不佳:网络似乎根本没有在学习。
我真的可以使用一些指导来帮助我入门。具体来说:RNN 是否适合解决此类问题?模型的正确输入形状是什么?我知道这取决于网络的架构,所以我想我的下一个问题是:能够计算回归预测的简单架构是什么?
我的输入数据是这样的,我有 m=50,000 个光谱,每个光谱有 n=7000 个数据点,并且我试图学习 L=3 个输出标签。我还有具有相同 n 和 L 维度的测试集和交叉验证集。当将输入数据构造为 (m,n,1) 并将输出目标构造为 (m,L) 并使用以下架构时,损失似乎并没有减少。
n=7000
L=3
## train_X.shape = (50000, n, 1)
## train_Y.shape = (50000, L)
## cv_X.shape = (10000, n, 1)
## cv_Y.shape = (10000, L)
batch_size=32
lstm_layers = [16, 32]
input_shape = (None, n, 1)
model = Sequential([
InputLayer(batch_input_shape=input_shape),
LSTM(lstm_layers[0],return_sequences=True, dropout_W=0.2, dropout_U=0.2),
LSTM(lstm_layers[1], return_sequences=False),
Dense(L),
Activation('linear')
])
model.compile(loss='mean_squared_error',
optimizer='adam',
metrics=['accuracy'])
model.fit(train_X, train_Y, batch_size=batch_size, nb_epoch=20,
validation_data=(cv_X, cv_Y), verbose=2)
我也曾尝试将我的输入形状更改为 (m, 1, n),但仍然没有成功。我不是在寻找最佳网络,只是在寻找可以训练的东西,然后我可以从那里获取它。我的输入数据不是时间序列的,但频谱的一部分与前一部分之间存在关系,所以有没有一种方法可以将每个频谱构造成一个二维数组,让 RNN 从中学习恒星参数光谱?
最佳答案
首先你设置
train_X.shape = (50000, n, 1)
然后你写
input_shape = (None, 1, n)
为什么不试试
input_shape = (None, n, 1) ?
对于您的 RNN 来说,接收一系列 n
时间步和每个时间步 1 个值比相反的方式更有意义。
有帮助吗? :)
**编辑:**
好吧,在重新阅读这里是我对你的问题的 2cents:LSTM 不是一个好主意。
1) 因为没有“时间”信息,所以频谱信息中没有“方向”。例如,LSTM 擅长捕捉不断变化的世界状态。将频谱开头的信息与结尾的信息结合起来并不是最好的。它将从头开始“读取”,并且随着状态更新,该信息将消失。您可以尝试双向 LSTM 来反驳“没有方向”的事实。但是,转到第二点。
2) 7000 个时间步对于 LSTM 来说太多了。当它训练时,在反向传播步骤中,LSTM 展开并且信息必须经过“7000 层”(实际上不是 7000,因为它们具有相同的权重)。这是非常非常难训练的。我会将 LSTM 限制为最多 100 步(根据我的经验)。
否则你的输入形状是正确的:)
您是否尝试过深度全连接网络?!我相信这会更有效率。
关于python - Keras RNN 回归输入维度和架构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42708005/
我使用 tensorflow 实现了一个简单的 RNN 模型来学习时间序列数据的可能趋势并预测 future 值。然而,该模型总是在训练后产生相同的值。实际上,它得到的最佳模型是: y = b. RN
我正在关注this tutorial关于循环神经网络。 这是导入: import tensorflow as tf from tensorflow.examples.tutorials.mnist i
一段时间以来,我一直在苦思冥想,无法弄清楚我在实现这些 RNN 时做错了什么(如果有的话)。为了让你们省去前向阶段,我可以告诉你们这两个实现计算相同的输出,所以前向阶段是正确的。问题出在倒退阶段。 这
我正在用 RNN 练习。我随机创建 5 个整数。如果第一个整数是奇数,则 y 值为 1,否则 y 为 0(因此,只有第一个 x 有效)。问题是,当我运行这个模型时,它不会“学习”:val_loss 和
我正在使用 bidirectional_rnn与 GRUCell但这是一个关于 Tensorflow 中 RNN 的普遍问题。 我找不到如何初始化权重矩阵(输入到隐藏,隐藏到隐藏)。它们是随机初始化的
我正在尝试找出适应开放命名实体识别问题的最佳模型(生物学/化学,因此不存在实体字典,但必须通过上下文来识别它们)。 目前我最好的猜测是调整 Syntaxnet,这样它就不会将单词标记为 N、V、ADJ
我正在通过以下方式训练 RNN: def create_rnn_model(stateful,length): model = Sequential() model.add(Simpl
我对 PyTorch 非常陌生,而且对一般神经网络也相当陌生。 我试图构建一个可以猜测性别名字的神经网络,并且基于判断国籍的 PyTorch RNN 教程。 我的代码运行没有错误,但损失几乎没有变化,
我正在尝试训练一个模型,返回单词序列(RNN)的类。 我为我的模型提供一系列嵌入: [ batchSize, sequence_length, word_embedding ] as float[]
我正在尝试预测输入向量中每个数字的类别。有3个类(class)。如果输入值从 0 变为 1,则为 1 类。如果从 1 变为 0,则为 2 类。否则为 0 类。 在第二个纪元之后,精度停留在 0.882
我正在尝试为我的日志分析项目开发一个顺序 RNN。 输入是一个日志序列,例如 [1,2,3,4,5,6,1,5,2,7,8,2,1] 目前我正在使用 keras 库中的 to_categorical
为了加深我对 RNN 和 LSTM 的理解,我正在尝试实现一个简单的 LSTM 来估计正弦波的频率和相位。事实证明,这出奇地难以收敛。 MSE 相当高(以千为单位)唯一似乎有点工作的是,如果我生成所有
请帮助我编写以下代码,当我尝试直接在数据上拟合模型时,该代码运行良好,但在网格搜索上失败(我已注释掉直接 model.fit()我的 grid.fit() 语句末尾的部分,这给了我满意的结果。还请告诉
前提1: 关于 RNN 层中的神经元 - 我的理解是,在“每个时间步,每个神经元都接收输入向量 x (t) 和前一个时间步的输出向量 y (t –1)”[1]: 前提2: 据我了解,在 Pytorch
我想训练一个 RNN 来解决一个简单的回归问题。我有一个形状为 (35584,) 的数组 X_train,它表示几年来每小时的测量值。我还有相应的 Y_train 形状为 (35584,) 作为预期值
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 4 年前。 Improve this qu
pytorch实现变长输入的rnn分类 输入数据是长度不固定的序列数据,主要讲解两个部分 1、Data.DataLoader的collate_fn用法,以及按batch进行padding数据
基于循环神经网络(RNN)的古诗生成器,具体内容如下 之前在手机百度上看到有个“为你写诗”功能,能够随机生成古诗,当时感觉很酷炫= = 在学习了深度学习后,了解了一下原理,打算自己做个实现练练手
使用循环神经网络(RNN)实现影评情感分类 作为对循环神经网络的实践,我用循环神经网络做了个影评情感的分类,即判断影评的感情色彩是正面的,还是负面的。 选择使用RNN来做情感分类,主要是因为影评
我的目标是在 Keras/TensorFlow 中构建一个 RNN,它由循环单元层(GRU、LSTM 等)以及从网络底部到顶部的循环组成,以添加注意力机制或特殊的内存类型。我不熟悉符号循环,所以首先我
我是一名优秀的程序员,十分优秀!