python - Tensorflow 队列 - 在训练数据和验证数据之间切换

转载作者：IT老高更新时间：2023-10-28 21:11:58

25

4

我正在尝试使用队列从 Tensorflow 中的文件加载数据。

我想在每个 epoch 结束时使用验证数据运行图表，以便更好地了解训练的进展情况。

这就是我遇到问题的地方。我似乎无法弄清楚如何使用队列时在训练数据和验证数据之间进行切换。

我已将我的代码精简为一个最小的玩具示例，以便更容易得到帮助。我没有包含加载图像文件、执行推理和训练的所有代码，而是在文件名加载到队列中的位置。

import tensorflow as tf

#  DATA
train_items = ["train_file_{}".format(i) for i in range(6)]
valid_items = ["valid_file_{}".format(i) for i in range(3)]

# SETTINGS
batch_size = 3
batches_per_epoch = 2
epochs = 2

# CREATE GRAPH
graph = tf.Graph()
with graph.as_default():
    file_list = tf.placeholder(dtype=tf.string, shape=None)
    
    # Create a queue consisting of the strings in `file_list`
    q = tf.train.string_input_producer(train_items, shuffle=False, num_epochs=None)
    
    # Create batch of items.
    x = q.dequeue_many(batch_size)
    
    # Inference, train op, and accuracy calculation after this point
    # ...


# RUN SESSION
with tf.Session(graph=graph) as sess:
    # Initialize variables
    sess.run(tf.global_variables_initializer())
    sess.run(tf.local_variables_initializer())
    
    # Start populating the queue.
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)
    
    try:
        for epoch in range(epochs):
            print("-"*60)
            for step in range(batches_per_epoch):
                if coord.should_stop():
                    break
                train_batch = sess.run(x, feed_dict={file_list: train_items})
                print("TRAIN_BATCH: {}".format(train_batch))
    
            valid_batch = sess.run(x, feed_dict={file_list: valid_items})
            print("\nVALID_BATCH : {} \n".format(valid_batch))
    
    except Exception, e:
        coord.request_stop(e)
    finally:
        coord.request_stop()
        coord.join(threads)

变化和实验

为 `num_epochs`

尝试不同的值

num_epochs=无

如果我将 tf.train.string_input_producer() 中的 num_epochs 参数设置为None 它给出以下输出，这表明它正在按预期运行两个时期，但它正在使用数据运行评估时从训练集中获取。

------------------------------------------------------------
TRAIN_BATCH: ['train_file_0' 'train_file_1' 'train_file_2']
TRAIN_BATCH: ['train_file_3' 'train_file_4' 'train_file_5']

VALID_BATCH : ['train_file_0' 'train_file_1' 'train_file_2']

------------------------------------------------------------
TRAIN_BATCH: ['train_file_3' 'train_file_4' 'train_file_5']
TRAIN_BATCH: ['train_file_0' 'train_file_1' 'train_file_2']

VALID_BATCH : ['train_file_3' 'train_file_4' 'train_file_5']

num_epochs=2

如果我将 tf.train.string_input_producer() 中的 num_epochs 参数设置为 2它给出了以下输出，这表明它甚至根本没有运行完整的两个批处理(并且评估仍在使用训练数据)

------------------------------------------------------------
TRAIN_BATCH: ['train_file_0' 'train_file_1' 'train_file_2']
TRAIN_BATCH: ['train_file_3' 'train_file_4' 'train_file_5']

VALID_BATCH : ['train_file_0' 'train_file_1' 'train_file_2']

------------------------------------------------------------
TRAIN_BATCH: ['train_file_3' 'train_file_4' 'train_file_5']

num_epochs=1

如果我将 tf.train.string_input_producer() 中的 num_epochs 参数设置为 1希望它会被冲走队列中的任何其他训练数据，以便它可以利用验证数据，我得到以下输出，这表明它正在终止它通过了一个时期的训练数据，并且没有通过加载评估数据。

------------------------------------------------------------
TRAIN_BATCH: ['train_file_0' 'train_file_1' 'train_file_2']
TRAIN_BATCH: ['train_file_3' 'train_file_4' 'train_file_5']

将 `capacity` 参数设置为各种值

我也试过设置 capacity 参数tf.train.string_input_producer() 到小的值，例如 3 和 1。但是这些对结果没有影响。

我应该采取什么其他方法？

我还可以采取哪些其他方法在训练数据和验证数据之间切换？我必须创建单独的队列吗？我不知道如何做到这一点工作。我是否还必须创建额外的协调器和队列运行器？

最佳答案

我正在编制一份可能解决此问题的潜在方法列表。其中大部分只是模糊的建议，没有实际的代码示例来展示如何使用它们。

默认占位符

建议 here

使用 tf.cond()

建议 here

sygi 在这个 stackoverflow 线程上也提出了建议。 link

使用 tf.group() 和 tf.cond()

建议 here

make_template() 方法

建议 here和 here

共享权重法

由 sygi 在这个 stackoverflow 线程 (link) 中建议。这可能与 make_template() 方法相同。

QueueBase() 方法。

建议 here带有示例代码 here在这个线程上适应我的问题的代码。 link

训练桶法

建议 here

关于python - Tensorflow 队列 - 在训练数据和验证数据之间切换，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41162955/

25

4

0

文章推荐： python - 在 Python 中创建 "reversed"列表的最佳方法？

文章推荐： Java 堆转储错误 - 元数据似乎不是多态的

文章推荐： python - 一致地创建相同的随机 numpy 数组

文章推荐： java - Objects.equals 和 Object.equals

java - jms 队列 vs 内存中 java 队列
我遇到一种情况，我需要从某个主题读取(正在进行的)消息并将它们放入另一个 Queue 中。我怀疑我是否需要 jms Queue 或者我可以对内存中的 java Queue 感到满意。我将通过同一 jv
数据结构-队列
队列也是一种操作受限的线性数据结构，与栈很相似。 01、定义栈的操作受限表现为只允许在队列的一端进行元素插入操作，在队列的另一端只允许删除操作。这一特性可以总结为先进先出（First In
队列——数据结构严蔚敏C语言版
队列的定义队列(Queue):先进先出的线性表队列是仅在队尾进行插入和队头进行删除操作的线性表队头(front)：线性表的表头端,即可删除端队尾(rear)：线性表的表尾端,即可插入端由于这
Redis专题-队列
Redis专题-队列首先，想一想 Redis 适合做消息队列吗？ 1、消息队列的消息存取需求是什么？redis中的解决方案是什么？无非就是下面这几点： 0、数据可以顺序读
Python数据结构与算法（3.3）——队列
0. 学习目标栈和队列是在程序设计中常见的数据类型，从数据结构的角度来讲，栈和队列也是线性表，是操作受限的线性表，它们的基本操作是线性表操作的子集，但从数据类型的角度来讲，它们与线性表又有着巨大的不
Python Redis 队列
我想在 redis + Flask 和 Python 中实现一个队列。我已经用 RQ 实现了这样的查询，如果你有 Flask 应用程序和任务在同一台服务器上工作，它就可以正常工作。我想知道是否有可能创
用于多用户环境的 Laravel 队列
我正在使用 Laravel 5.1，我有一个大约需要 2 分钟来处理的任务，这个任务特别是生成报告...... 现在，很明显，我不能让用户在我接受用户输入的同一页面上等待 2 分钟，而是我应该在后台处
Azure 队列 - 我可以验证消息只会被读取一次吗？
我正在使用 Azure 队列，并且有多个不同的进程从队列中读取数据。我的系统的构建方式假设每条消息只读取一次。这个Microsoft article声称 Azure 队列具有至少一次传送保证，这可
multithreading - Perl线程::队列
我正在创建一个Thread::Queue元素数组。我这样做是这样的: for (my $i=0; $i new; } 但是，当我在每个队列中填充这样的元素时 $queues[$index]->enq
Mercurial 队列 - 备份和共享未提交的补丁
我试图了解如何将我的 Mercurial 补丁推送到远程存储库(例如 bitbucket.org)，而不必先应用它们(实际上提交它们)。我的动机是在最终完成之前首先对我的工作进行远程备份，并且能够与其
Mercurial 队列 - 导出补丁
我的本地计算机上有一个 Mercurial 队列补丁，我需要与同事共享该补丁，但我不想将其提交到上游存储库。有没有一种简单的方法可以打包该补丁并与他分享？最佳答案 mq 将补丁作为不带扩展名的文
Java "not removing"队列
Java 中是否有任何类提供与 Queue 相同的功能，但有返回对象的选项，并且不要删除它，只需将其设置在集合末尾？最佳答案 Queue不直接提供这样的方法。但是，您可以使用 poll 和 add
svn - svn一次全部提交(队列)？
我在Windows上使用Tortoise svn客户端，我需要能够一次提交来自不同子文件夹的更改文件-一次提交。像在提交之前将文件添加到队列中之类的？我该怎么做？ Windows上是否还有另一个svn
JAVA 队列 - 单元测试失败
好吧，我正在尝试对我的 DSAQueue 类进行单元测试，它显示我的 isEmpty()、isFull() 和 dequeue() 方法失败。以下是我的 DSAQueue 代码。我认为我的 Dequ
没有数据库查询的 laravel 队列
我想尽量减少对传入请求的数据库查询。它目前需要写入 6 个不同的表。在返回响应之前不需要完成处理。因此，我考虑了 laravel 队列，但我想知道我是否也可以摆脱写入队列/作业表所需的单独查询。我可以
Java 队列。该程序结果为空。
我正在学习队列数据结构。我想用链表创建队列。我想编程输出:10 20程序输出:队列为空-1 队列为空-1 我哪里出错了？代码如下: class Node { int x; Node next
java - 队列，优先级如何实现
“当工作人员有空时，他们会根据主题的优先级列表从等待请求池中进行选择。在时间 t 到达的所有请求都可以在时间 t 进行分配。如果两名工作人员同时有空，则安排优先权分配给最近的工作最早安排的人。如果仍然
jQuery:ESC 队列
我正在开发一个巨大的应用程序，它使用一些子菜单、模式窗口、提示等。现在，我想知道在此类应用程序中处理 Esc 和单击外部事件的正确方法。 $(document).keyup(function(e)
C 队列，按排序顺序复制元素
所以如果我有一个队列 a --> b --> NULL; 当我使用函数时 void duplicate(QueueNodePtr pHead, QueueNodePtr *pTail) 它会给 a
使用键盘输入创建 FIFO 队列
我正在尝试为键盘输入实现 FIFO 队列，但似乎无法让它工作。我可以让键盘输入显示在液晶显示屏上，但这就是我能做的。我认为代码应该读取键盘输入并将其插入队列，然后弹出键盘输入并将值读取到液晶屏幕上。有

首页

博学

6Ren·AI

商城

python - Tensorflow 队列 - 在训练数据和验证数据之间切换

变化和实验

为 `num_epochs`

num_epochs=无

num_epochs=2

num_epochs=1

将 `capacity` 参数设置为各种值

我应该采取什么其他方法？

默认占位符

使用 tf.cond()

使用 tf.group() 和 tf.cond()

make_template() 方法

共享权重法

QueueBase() 方法。

训练桶法

首页

博学

6Ren·AI

商城

python - Tensorflow 队列 - 在训练数据和验证数据之间切换

变化和实验

为 num_epochs

num_epochs=无

num_epochs=2

num_epochs=1

将 capacity 参数设置为各种值

我应该采取什么其他方法？

默认占位符

使用 tf.cond()

使用 tf.group() 和 tf.cond()

make_template() 方法

共享权重法

QueueBase() 方法。

训练桶法

为 `num_epochs`

将 `capacity` 参数设置为各种值