machine-learning - 具有固定步长输出误差的 TensorFlow RNN 模型-6ren

machine-learning - 具有固定步长输出误差的 TensorFlow RNN 模型

转载作者：行者123 更新时间：2023-11-30 09:18:53

我开始了一个非常简单的 RNN 项目来巩固我在 TF 方面的知识，基本上是一个使用 LSTM 和 TF 的简单序列生成器。该项目只是一个多对一序列生成，输入是 4 个整数窗口，输出每个窗口只有一个 float 。输入的最小数量是 1，最大数量是 61，因此我可以从 61 开始进行预测。我只是使用了一批所有输入，其形状为 [58,4,1]，输出的形状为 [58,1]。为了更好的可视化，输入和输出写在下面。

        Inputs                     Labels
[[[ 1],[ 2],[ 3],[ 4]], -------> [[0.0493],
 [[ 2],[ 3],[ 4],[ 5]], ------->  [0.0634],
 [[ 3],[ 4],[ 5],[ 6]], ------->  [0.0773],
 [[ 4],[ 5],[ 6],[ 7]], ------->  [0.0909],
   ..   ..   ..   ..    ------->     ...  ,
 [[55],[56],[57],[58]], ------->  [0.5503],
 [[56],[57],[58],[59]], ------->  [0.5567],
 [[57],[58],[59],[60]], ------->  [0.5630],
 [[58],[59],[60],[61]]] ------->  [0.5693]]

训练部分进行得非常顺利，我可以通过 500 个 epoch 达到大约 0.991 的准确度，但是当我尝试预测从 61 到 118 的某些值时，输出对于所有预测值都有固定的步长，但不知何故具有正确的值行为。

因为这个项目的目的只是为了学习基础知识，所以我决定使用 TF 中最简单的函数，因此 seq2seq 设施已被保留。 RNN的代码写在下面

def build_lstm(cell_lengh, cell_depth, batch_size, keep_prob):
    def lstm_row(cell_length, keep_prob):
        cell_row = tf.contrib.rnn.BasicLSTMCell(cell_lengh)
        cell_row = tf.contrib.rnn.DropoutWrapper(cell_row, keep_prob)
        return cell_row

    cell = tf.contrib.rnn.MultiRNNCell([lstm_row(cell_lengh, keep_prob) for _ in range(cell_depth)])
    initial_state = cell.zero_state(batch_size, tf.float32)

    return cell, initial_state

tf.reset_default_graph()

inputs = tf.placeholder(tf.float32, [None, feature_length, 1], name='inputs')
labels = tf.placeholder(tf.float32, [None, output_length], name='labels')
keep_prob = tf.placeholder(tf.float32, name='kpprob')

lstm_cell, initial_state = build_lstm(40, 2, batch_size=batch_size, keep_prob=keep_prob)
lstm_output, final_state = tf.nn.dynamic_rnn(lstm_cell, inputs, initial_state=initial_state)
lstm_outout_seq = lstm_output[:,-1,:]

dense_0 = tf.layers.dense(inputs=lstm_outout_seq, units=120, activation=tf.nn.relu)
dropout_0 = tf.layers.dropout(dense_0, rate=0.7)

with tf.variable_scope('sigmoid'):
    W = tf.Variable(tf.truncated_normal((120, 1), stddev=0.1), name='weights')
    b = tf.Variable(tf.zeros(1), name='bias')
logits = tf.matmul(dropout_0, W) + b

output = tf.nn.sigmoid(logits, name='output')

loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=logits, labels=labels))
correct_predictions = tf.abs(output - labels)
total_correct = tf.ones_like(correct_predictions)
accuracy = tf.reduce_mean(total_correct - correct_predictions)
learning_rate = tf.placeholder(tf.float32, name='learning_rate')
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(loss)

l_rate = 0.001
epochs = 500
kp_prob = 0.7

with tf.Session() as session:
    session.run(tf.global_variables_initializer())
    for e in range(epochs):
        new_state = session.run([initial_state])
        feeder = {
            inputs: wnd_x,
            labels: wnd_y_scl,
            keep_prob: kp_prob,
            learning_rate: l_rate,
            initial_state: new_state
        }
        session_loss,
        session_accuracy,
        session_output, _,
        last_state = session.run([loss, accuracy, output,
                                  optimizer, final_state], feed_dict=feeder)
        print('Epoch {0}/{1}:\t'.format(e, epochs),
              'training loss {0}\t'.format(session_loss),
              'accuracy {0}\t'.format(session_accuracy))

    new_state = session.run([initial_state])
    feeder = {
        inputs: unseen_data_rsp,
        keep_prob: 1.0,
        initial_state: new_state
    }
    session_output = session.run([output], feed_dict=feeder)

如前所述，在推理阶段，预测已固定下降，但不知何故具有正确的行为，即曲线的导数随时间步长正确变化。

在训练阶段我有以下输出:

Epoch 999/1000: training loss = 0.5913468599319458 | accuracy = 0.9909629225730896
         Input               Label          Output
[[ 1],[ 2],[ 3],[ 4]]  -->  [0.0493]  ...  [0.0591]
[[ 2],[ 3],[ 4],[ 5]]  -->  [0.0634]  ...  [0.0802]
[[ 3],[ 4],[ 5],[ 6]]  -->  [0.0773]  ...  [0.0777]
[[ 4],[ 5],[ 6],[ 7]]  -->  [0.0909]  ...  [0.1035]
  ..   ..   ..   ..    ...     ...            ...
[[55],[56],[57],[58]]  -->  [0.5503]  ...  [0.5609]
[[56],[57],[58],[59]]  -->  [0.5567]  ...  [0.5465]
[[57],[58],[59],[60]]  -->  [0.5630]  ...  [0.5543]
[[58],[59],[60],[61]]  -->  [0.5693]  ...  [0.5614]

在推理阶段，我有以下输出:

          Input                Prediction
[[ 58],[ 59],[ 60],[ 61]]  -->  [0.4408]
[[ 59],[ 60],[ 61],[ 62]]  -->  [0.4459]
[[ 60],[ 61],[ 62],[ 63]]  -->  [0.4510]
[[ 61],[ 62],[ 63],[ 64]]  -->  [0.4559]
  ...   ...   ...   ...    ...     ...
[[112],[113],[114],[115]]  -->  [0.6089]
[[113],[114],[115],[116]]  -->  [0.6101]
[[114],[115],[116],[117]]  -->  [0.6113]
[[115],[116],[117],[118]]  -->  [0.6124]

正如您所看到的，推理的第一个输入与训练的最后一个输入相同。我在这里不明白的是为什么相同的输入给了我 2 个不同的输出，以及为什么这些输出有一个固定的步长，大约 0.11。感谢你们的帮助，对长文本感到抱歉，我可以根据要求将其缩短。

最佳答案

在推理过程中，您正在重置状态。因此，您会在同一输入上获得两个不同的值，因为两种情况下网络的状态都不同。

要在预测后保持状态，您需要执行以下操作:

#iterate for each prediction {
  feeder = {
    inputs: unseen_data_rsp,
    keep_prob: 1.0,
    initial_state: last_state
  }
  session_output, last_state = session.run([output,final_state], feed_dict=feeder)
}

此外，为了通过第一个推理输入准确地获得训练结果，您需要首先提供所有训练示例，以确保您以正确的状态开始推理。另一种方法是保存网络状态，然后您可以在预测期间重复使用该状态。

关于machine-learning - 具有固定步长输出误差的 TensorFlow RNN 模型，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47336169/

文章推荐： javascript - 不使用 class 关键字扩展数组

文章推荐： machine-learning - 替换卡住 Tensorflow 模型中的节点

algorithm - 计算圆圈中的点 - 步长？
我想计算一个圆上的所有点。我已经知道我可以使用 x = r * cos(theta) + x0, y = r * sin(theta) + y0 来计算点 - 但是我想知道是否有是根据我的像素 Can
python - 平均值和最大值之间差距较大的列表的 Pyqt 步长
我正在 pyqt 中构建一个工具，它有一个 slider 可以对几何区域进行排序。在某些情况下，数据的平均值或最小面积值与最大值之间可能存在极大差距。让它像:面积 = [0.5、1.0、1.3、1.
c++ - 您将如何计算指数移动平均线的 X° 步长？
我使用基本的指数移动平均线对一些数据进行平滑处理 filter : int main () { double a0 = 0.1; double input = 8.0; dou
python - 获取python中值之间的最大距离(步长)的方法？
给定一个整数列表是否存在找到值之间最大距离的默认方法？所以如果我有这个数组 [1, 3, 5, 9, 15, 30] 值之间的最大步长是 15。列表对象是否有这样做的方法？最佳答案不，list
javascript - 以指数方式更改 html slider 步长
我试图通过每张幻灯片上 10 的幂来更改 slider 步长，但它无法正常工作。我不确定是应该使用 stepUp() 还是直接更改 step 的值。这就是我如何增加 10 的幂: var incre
python - 如何更改 scipy curve_fit/least_squares 步长？
我有一个 python 函数，它接受一堆(1 个或 2 个)参数并返回一个二维数组。我一直在尝试使用 scipy curve_fit 和 least_squares 来优化输入参数，以便生成的二维数组
javascript - html 输入数字，最小值+步长，让步长忽略最小值？
是否可以让 step 忽略 min 属性？现在，它的步骤如下:2, 7, 12, 17, ... 相反，我希望它是:2, 5, 10, 15, 20, ... 我的真实代码实际上使用了这样的动态值
CSS 100% 宽度，每 20px 步长
是否可以在纯css中设置一些宽度变化的步骤？假设我的 div 宽度为 100%，因此当容器为 30px 时，它的宽度将为 30px。但是是否可以将一些“跳转”设置为 20px，以便当容器为 30px
C++ 迭代器 "for loop"习惯用法，步长 > 1 并允许非随机访问反向迭代器
抱歉问题措辞。如果您能想到更好的方式来表达问题，请进行编辑。要一次一步地遍历 std::vector v，我们有很多选择。以下是一些立即浮现在脑海中的内容: 1. for ( auto & elem
matlab - 我如何强制 ode45 在 T 轴上采取精确的 0.01 步长？
我正在使用 Matlab 求解微分方程。我想强制 ode45 采取恒定步长，因此它在求解方程时总是在 T 轴上递增 0.01。我该怎么做？ ode45 始终采取优化的随机步骤，我似乎无法弄清楚如何使其

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

machine-learning - 具有固定步长输出误差的 TensorFlow RNN 模型