python - Tensorflow:训练并不能提高准确性-6ren

python - Tensorflow:训练并不能提高准确性

转载作者：行者123 更新时间：2023-11-30 09:17:39

24

4

我刚刚开始学习tensorflow，并编写了一个在MNIST上进行锻炼的模型。因此我正在关注一本书，但仍然存在问题，您能帮我解决这个问题吗？

以下是我的代码，里面有问题描述，非常感谢!

x = tf.placeholder(tf.float32,[None,INPUT_NODE],name='input')
y_ = tf.placeholder(tf.float32,[None,OUTPUT_NODE],name='output')
weights1 = tf.Variable(tf.truncated_normal([INPUT_NODE,LAYER1_NODE],stddev=0.1))
biases1 = tf.Variable(tf.constant(0.1,shape=[LAYER1_NODE]))
weights2 = tf.Variable(tf.truncated_normal([LAYER1_NODE,OUTPUT_NODE],stddev=0.1))
biases2 = tf.Variable(tf.constant(0.1,shape=[OUTPUT_NODE]))

下一个 y = ()...定义前向传播而不使用移动平均模型。

y = inference(x,None,weights1,biases1,weights2,biases2)
global_step = tf.Variable(0,trainable=False)
variable_averages = tf.train.ExponentialMovingAverage(MOVING_AVERAGE_DECAY,global_step)
variables_averages_op = variable_averages.apply(tf.trainable_variables())

下一个average_y =()...使用移动平均模型定义前向传播。

average_y = inference(x,variable_averages,weights1,biases1,weights2,biases2)

cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y,labels=tf.arg_max(y_,1))
cross_entropy_mean = tf.reduce_mean(cross_entropy)
regularizer = tf.contrib.layers.l2_regularizer(REGULARIZATION_RATE)
regularization = regularizer(variable_averages.average(weights1)) +\
                 regularizer(variable_averages.average(weights2))
loss = cross_entropy_mean + regularization
learning_rate = tf.train.exponential_decay(
    LEARNING_RATE_BASE,                        
    global_step,                                
    mnist.train.num_examples / BATCH_SIZE,      
    LEARNING_RATE_DECAY                        
)
train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss,global_step=global_step)
train_op = tf.group(train_step,variables_averages_op)

问题是当我使用average_y来计算准确度时，似乎训练根本无助于提高:

经过 0 个训练步骤后，验证中的 acc 为 0.0742

经过 1000 个训练步骤后，验证中的 acc 为 0.0924

经过 2000 个训练步骤后，验证中的 acc 为 0.0924

当我使用 y 而不是average_y时，一切都很好。这真的让我很困惑:

经过 0 个训练步骤后，验证中的 acc 为 0.0686

经过 1000 个训练步骤后，验证中的 acc 为 0.9716

经过 2000 个训练步骤后，验证中的 acc 为 0.9768

#correct_prediction = tf.equal(tf.arg_max(y,1),tf.arg_max(y_,1))
correct_prediction = tf.equal(tf.arg_max(average_y,1),tf.arg_max(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
with tf.Session() as sess:
    tf.initialize_all_variables().run()
    validate_feed = {
        x:mnist.validation.images,
        y_:mnist.validation.labels
    }
    test_feed={
        x:mnist.test.images,
        y_:mnist.test.labels
    }
    for i in range(TRAINING_STEPS):
        if i%1000 == 0:
            validate_acc = sess.run(accuracy,feed_dict=validate_feed)
            print("After %d training steps, acc in validatation is %g"%(i,validate_acc))
        xs,ys = mnist.train.next_batch(BATCH_SIZE)
        sess.run([train_op,global_step],feed_dict={x:xs,y_:ys})
    test_acc = sess.run(accuracy,feed_dict=test_feed)
    print("After %d training steps, acc in test is %g" % (TRAINING_STEPS, test_acc))

最佳答案

从您的代码片段中，您正在训练相对于 y logits 而不是 average_y 的分类损失，因此具有指数移动平均线的推理图实际上没有经过训练

cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y,labels=tf.arg_max(y_,1))

关于python - Tensorflow:训练并不能提高准确性，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50829631/

24

4

0

文章推荐： python - 如何使用 Python 推断给定数据来填充 NaN 值？

文章推荐： javascript - 获取属性中最大的元素

文章推荐： javascript - React 组件渲染两次

PHP sleep 准确性
我使用以下代码来查看用户在特定页面上的停留时间。我为此脚本使用了带有 src 属性的隐藏图像: $timer_seconds = 1; while(!connection_aborted()) {
具有自定义损失函数的 Keras 准确性
我在 Keras 中使用自定义损失函数: def get_top_one_probability(vector): return (K.exp(vector) / K.sum(K.exp(vect
java - 基本数据类型准确性
当我使用 long 来节省一个月毫秒时，我发现一个问题。但我打印负数。所以我做了一个测试代码如下: LogUtils.d(TAG, "long max time:"+Long.MAX_VALUE);
python - 解释训练损失/准确性与验证损失/准确性
关于使用 Lenet5 网络解释某些优化器在 MNIST 上的性能，我有几个问题，以及验证损失/准确性与训练损失/准确性图表究竟告诉我们什么。所以一切都是在 Keras 中使用标准的 LeNet5 网
azure - Azure 搜索索引的大小是否会影响性能/准确性？
我有 1000 个 pdf(每个 200 页)。我需要将每个 pdf 添加到 Azure 搜索索引中的索引(作为小文本 block 和相关元数据，例如每个 pdf 200 个 block ) 已达到
SQL Server DATEDIFF 准确性
我必须在 mssql 数据库中存储一些间隔。我知道日期时间的准确性约为。 3.3ms(只能结束0、3、7)。但是当我计算日期时间之间的间隔时，我发现结果只能以 0、3 和 6 结尾。所以我总结的间隔越
java - 融合位置管理器 API 准确性
我想制作一个需要将位置精确到大约 1m 或更小的 Android 应用程序。“Fused Location Manager API”是否足够好，或者 GPS 永远不会如此准确，无论是否与其他传感器融合
python - pySerial list_port 准确性
我想使用 pySerial 的 serial.tools.list_ports.comports() 列出可用的 COM 端口。阅读documentation : The function retu
python - pyomo 准确性；客观规则不返回期望值
使用 pyomo 和 glpk 求解器，我定义了以下目标规则: def cost_rule(m): return (sum(m.rd[i]*m.pRdImp*m.dt - m.vr[i]*m.
java - Lucene 空间、准确性
我正在遵循“Lucene in Action”中的示例，第 308-315 页，它描述了 Lucene Spatial。我正在使用 lucene 2.9.4。我用过 http://geocoder.u
android - 线程 sleep 准确性
我一直在试验各种计时方法的代码。创建延迟的一种方法是使用thread.sleep（millis）运行线程，但可以很好地说明，线程“唤醒”的时间并不完全准确，可能在这个时间之前或之后。然后我遇到一个定义
C++提高 sleep 准确性
我在使用 boost::sleep() 函数时遇到奇怪的问题。我有这个基本代码: #include #include #include void thread_func() { time
python - pytesseract 提高了图像上模糊数字的 OCR 准确性
数字示例我正在使用标准的 pytesseract img 来发送文本。我尝试过仅使用数字选项，90% 的情况下它是完美的，但上面是一个非常错误的例子!这个例子根本没有产生任何字符如您所见，现在有字
python - Pytesseract 提高 OCR 准确性
我想从 python 中的图像中提取文本.为了做到这一点，我选择了 pytesseract .当我尝试从图像中提取文本时，结果并不令人满意。我也经历过this并实现了列出的所有技术。然而，它的表现似乎
tensorflow - 损失、准确性、验证损失、验证准确性之间有什么区别？
在每个时代结束时，我得到例如以下输出: Epoch 1/25 2018-08-06 14:54:12.555511: 2/2 [==============================] - 86
barcode - 二维条码与一维条码 - 速度、准确性、尺寸
我想为我的移动项目需求之一实现条形码。要存储的数据量非常少(<25 个字母数字)。我想知道对于这个项目实现一维条形码或二维条形码(特别是二维码)是否更明智。如果有人能从 1d 与 2d 的角度对我进行
python - 二元分类问题中每个概率截止的准确性(python sklearn 准确性)
想象一个二元分类问题。假设我在 pred_test 中存储了 800,000 个预测概率。我将 cutoff 定义为 pred_test 中的任何值，以便大于或等于 cutoff 的值被分配值 1 和
python - “Booster”对象没有属性 'score' - 准确性
已关闭。此问题需要 debugging details 。目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and the
android - Android 设备运行时的 iBeacon 准确性
我正在使用 iBeacon 和 Altbeacon 测试定位系统。我发现我的三角测量结果实际上非常准确，但有时需要 5 秒以上才能看到正确的结果。例如，假设我目前正站在A点。 Altbeacon +
c# - 比较 2 个数据表以查找列之间的差异/准确性
因此，我有 2 个独立的数据表，它们看起来非常相同，但它们行中的值可能不同。编辑: 我可以通过创建一个可以用作主键的临时标识列来获得唯一 ID，如果这样做更容易的话。所以将 ID 列视为主键。表A

首页

博学

6Ren·AI

商城

python - Tensorflow:训练并不能提高准确性