python - Keras/Tensorflow中的类生成器(继承序列)线程安全吗？-6ren

python - Keras/Tensorflow中的类生成器(继承序列)线程安全吗？

转载作者：行者123 更新时间：2023-12-04 19:27:10

为了使模型的训练更快，在CPU上填充/生成批次并在GPU上并行运行模型的训练似乎是一个好习惯。为此，可以使用Python编写一个生成器类，该类继承Sequence类。

这是文档的链接:
https://www.tensorflow.org/api_docs/python/tf/keras/utils/Sequence

该文档指出的重要内容是:

Sequence are a safer way to do multiprocessing. This structure guarantees that the network will only train once on each sample per epoch which is not the case with generators.

它给出了一个简单的代码示例，如下所示:

from skimage.io import imread
from skimage.transform import resize
import numpy as np
import math

# Here, `x_set` is list of path to the images
# and `y_set` are the associated classes.

class CIFAR10Sequence(Sequence):

    def __init__(self, x_set, y_set, batch_size):
        self.x, self.y = x_set, y_set
        self.batch_size = batch_size

    def __len__(self):
        return math.ceil(len(self.x) / self.batch_size)

    def __getitem__(self, idx):
        batch_x = self.x[idx * self.batch_size:(idx + 1) *
        self.batch_size]
        batch_y = self.y[idx * self.batch_size:(idx + 1) *
        self.batch_size]

        return np.array([
            resize(imread(file_name), (200, 200))
               for file_name in batch_x]), np.array(batch_y)

据我所知，在模型中理想地要做的是创建此生成器类的实例并将其提供给 fit_generator(...)函数。

gen = CIFAR10Sequence(x_set, y_set, batch_size)
# Train the model
model.fit_generator(generator=gen,
                    use_multiprocessing=True,
                    workers=6)

这是Keras文档的报价:

The use of keras.utils.Sequence guarantees the ordering and guarantees the single use of every input per epoch when using use_multiprocessing=True.

在这种情况下，我假设此设置是线程安全的。
问题1)我的假设正确吗？

但是，一件令人困惑的事情是，在Windows 10上，参数 use_multiprocessing可能未设置为True。似乎只能在Linux上将其设置为True。 (我不知道在其他平台上情况如何。)但是 workers参数仍然可以设置为大于0的值。

让我们看一下这两个参数的定义:

workers: Integer. Maximum number of processes to spin up when using process-based threading. If unspecified, workers will default to 1. If 0, will execute the generator on the main thread.

use_multiprocessing: Boolean. If True, use process-based threading. If unspecified, use_multiprocessing will default to False. Note that because this implementation relies on multiprocessing, you should not pass non-picklable arguments to the generator as they can't be passed easily to children processes.

因此，通过使用 workers参数，似乎可以创建多个进程来独立于 use_multiprocessing是否为True来加快训练速度。

如果要使用继承 Sequence的生成器类(在Windows 10上为，)，则必须将 use_multiprocessing设置为False，如下所示:

gen = CIFAR10Sequence(x_set, y_set, batch_size)
# Train the model
model.fit_generator(generator=gen,
                    use_multiprocessing=False,  # CHANGED
                    workers=6)

而且这里仍然有多个进程在运行，因为worker = 6。

问题2)将 use_multiprocessing参数设置为False之后，此设置是否仍然是线程安全的，或者线程安全特性现在丢失了吗？根据文档，我无法明确说明。

问题3)仍与此主题相关...当以这种方式进行训练(CPU生成数据并在GPU上进行训练)时，如果所训练的模型较浅，则GPU利用率最终会非常低并且GPU利用率不断提高，因为GPU一直在等待来自CPU的数据。在这种情况下，是否有办法利用一些GPU资源进行数据生成？

最佳答案

在看过这篇文章的人中，似乎没有人给出最终答案，因此我想给出对我有用的答案。由于该领域缺乏文档，我的答案可能缺少一些相关细节。请随时添加我在这里没有提及的更多信息。

看来，在 Windows 中不支持使用Python编写继承Sequence类的生成器类。 (您似乎可以使其在Linux上运行。)要使其运行，您需要设置参数use_multiprocessing=True(使用类方法)。但是如上所述，它在Windows上不起作用，因此您必须将use_multiprocessing设置为False(在Windows上)。
但是，这并不意味着多重处理在Windows上不起作用。即使您设置了use_multiprocessing=False，使用以下设置运行代码时仍可以支持多处理，您只需将workers参数设置为任何大于1的值即可。

例子:

history = \
   merged_model.fit_generator(generator=train_generator,
                              steps_per_epoch=trainset_steps_per_epoch,
                              epochs=300,
                              verbose=1,
                              use_multiprocessing=False,
                              workers=3,
                              max_queue_size=4)

在这一点上，让我们再次记住Keras文档:

The use of keras.utils.Sequence guarantees the ordering and guarantees the single use of every input per epoch when using use_multiprocessing=True.

据我了解，如果是 use_multiprocessing=False，则生成器不再是线程安全的，这使得编写继承 Sequence的 生成器类变得很困难。

为了解决这个问题，我自己编写了一个生成器，该生成器手动使线程安全。这是一个示例伪代码:

import tensorflow as tf
import threading

class threadsafe_iter:
    """Takes an iterator/generator and makes it thread-safe by
    serializing call to the `next` method of given iterator/generator.
    """
    def __init__(self, it):
        self.it = it
        self.lock = threading.Lock()

    def __iter__(self):
        return self

    def __next__(self): # Py3
        return next(self.it)

    #def next(self):     # Python2 only
    #    with self.lock:
    #        return self.it.next()

def threadsafe_generator(f):
    """A decorator that takes a generator function and makes it thread-safe.
    """
    def g(*a, **kw):
        return threadsafe_iter(f(*a, **kw))
    return g


@threadsafe_generator
def generate_data(tfrecord_file_path_list, ...):

    dataset = tf.data.TFRecordDataset(tfrecord_file_path_list)

    # example proto decode
    def _parse_function(example_proto):
      ...
      return batch_data

    # Parse the record into tensors.
    dataset = dataset.map(_parse_function)  

    dataset = dataset.shuffle(buffer_size=100000)

    # Repeat the input indefinitly
    dataset = dataset.repeat()  

    # Generate batches
    dataset = dataset.batch(batch_size)

    # Create an initializable iterator
    iterator = dataset.make_initializable_iterator()

    # Get batch data
    batch_data = iterator.get_next()

    iterator_init_op = iterator.make_initializer(dataset)

    with tf.Session() as sess:

        sess.run(iterator_init_op)

        while True:            
            try:
                batch_data = sess.run(batch_data)
            except tf.errors.OutOfRangeError:
                break
            yield batch_data

好吧，可以这样进行讨论是否真的很优雅，但似乎工作得很好。

总结一下:

如果在Windows上编写程序，请将use_multiprocessing设置为False。

(据我所知，截至目前)，在Windows上编写代码时，不支持编写继承Sequence的生成器类。 (我猜这是一个Tensorflow/Keras问题)。

要解决此问题，请编写一个普通的生成器，使生成器线程安全，然后将workers设置为大于1的数字。

重要说明:在此设置中，生成器在CPU上运行，而训练在GPU上完成。我可以观察到的一个问题是，如果您正在训练的模型足够浅，则GPU的利用率仍然很低，而CPU利用率却很高。如果模型很浅并且数据集足够小，那么将所有数据存储在内存中并在GPU上运行所有数据可能是一个不错的选择。它应该大大加快培训的速度。如果出于任何原因想要同时使用CPU和GPU，我的建议是尝试使用Tensorflow的tf.data API，该API可显着加快数据预处理和批处理的速度。如果生成器仅使用Python编写，则GPU会一直等待数据以继续进行训练。可以说有关Tensorflow/Keras文档的所有内容，但这确实是高效的代码!

如果您对API有更全面的了解，并且看到这篇文章，请随时在这里纠正我，以防万一我误解了任何内容，或者更新了API以解决问题，甚至在Windows上也是如此。

关于python - Keras/Tensorflow中的类生成器(继承序列)线程安全吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52932406/

文章推荐： xml - XSLT、xsltproc 参数

文章推荐： ubuntu - 防止 super 键进入 Ubuntu 20 中的搜索栏

文章推荐： sql - 具有多个记录(重叠)日期范围的工作日总和

css - 如何在CSS中用一种颜色绘制一半对 Angular 线，用另一种颜色绘制另一半对 Angular 线
我将 Bootstrap 与 css 和 java 脚本结合使用。在不影响前端代码的情况下，我真的很难在css中绘制这个背景。在许多问题中，人们将宽度和高度设置为 0%。但是由于我的导航栏，我不能使用
c - scanf ("%79[^\n]",line); 之间的区别vs scanf ("%79[^\n]\n"，线) vs scanf ("%79[^\n]s"，线)
我正在用 c 编写一个程序来读取文件的内容。代码如下: #include void main() { char line[90]; while(scanf("%79[^\
Javascript获取矩阵数组的对 Angular 线
我想使用 javascript 获取矩阵数组的所有对 Angular 线。假设输入输出如下: input = [ [1,2,3], [4,5,6], [7,8,9], ] output =
pdfmake - 线，圆和其他形状？
可以用pdfmake绘制lines，circles和other shapes吗？如果是，是否有documentation或样本？我想用jsPDF替换pdfmake。最佳答案是的，有可能。 pdfm
svg - 如何制作带有边框的SVG“线”？
我有一个小svg小部件，其目的是显示角度列表（参见图片）。现在，角度是线元素，仅具有笔触，没有填充。但是现在我想使用一种“内部填充”颜色和一种“笔触/边框”颜色。我猜想line元素不能解决这个问题，
java - 线-三角形交点检查返回错误的交点
我正在为带有三角对象的 3D 场景编写一个非常基本的光线转换器，一切都工作正常，直到我决定尝试从场景原点 (0/0/0) 以外的点转换光线。但是，当我将光线原点更改为 (0/1/0) 时，相交测试突
Python Shebang 线
这个问题已经有答案了: Why do people write "#!/usr/bin/env python" on the first line of a Python script? (22 个回
java - 如何在屏幕上绘制星号(*)线？
如何使用大约 50 个星号 * 并使用 for 循环绘制一条水平线？当我尝试这样做时，结果是垂直(而不是水平)列出 50 个星号。 public void drawAstline() { f
java - 球不动；线？
这是一个让球以对角线方式下降的 UI，但球保持静止；线程似乎无法正常工作。你能告诉我如何让球移动吗？请下载一个球并更改目录，以便程序可以找到您的球的分配位置。没有必要下载足球场，但如果您愿意，也可以
ant - Jmeter和Ant报90%线
我在我的一个项目中使用 Jmeter 和 Ant，当我们生成报告时，它会在报告中显示 URL、#Samples、失败、成功率、平均时间、最短时间、最长时间。我也想在报告中包含 90% 的时间线。现
Java Swing 线
我有一个不寻常的问题，希望有人能帮助我。我想用 Canvas (android) 画一条 Swing 或波浪线，但我不知道该怎么做。它将成为蝌蚪的尾部，所以理想情况下我希望它的形状更像三角形，一端更大
javafx粗笔画路径(线)与圆之间的碰撞问题
这个问题已经有答案了: Checking Collision of Shapes with JavaFX (1 个回答) 已关闭 8 年前。我正在使用 JavaFx 8 库。我的任务很简单:我想检
bash - 如何按编号的百分比拆分文件。线？
如何按编号的百分比拆分文件。行数？假设我想将我的文件分成 3 个部分(60%/20%/20% 部分)，我可以手动执行此操作，-_-: $ wc -l brown.txt 57339 brown.tx
圆圈之间的 HTML 线
我正在努力实现这样的目标: 但这就是我设法做到的。你能帮我实现预期的结果吗？更新: 如果我删除 bootstrap.css 依赖项，问题就会消失。我怎样才能让它与 Bootstrap 一起工作？
css - 转换比例导致间隙/线
我目前正在构建一个网站，但遇到了 transform: scale 的问题。我有一个按钮，当用户将鼠标悬停在它上面时，会发生两件事: 背景以对 Angular 线“扫过” 按钮标签颜色改变按钮稍微变
macos - 非常快速地绘制图形(线)
我需要使用直线和仿射变换绘制大量数据点的图形(缩放图形以适合 View )。目前，我正在使用 NSBezierPath，但我认为它效率很低(因为点在绘制之前被复制到贝塞尔路径)。通过将我的数据切割成
image - 从车牌上删除多余的像素/线
我正在使用基于 SVM 分类的 HOG 特征检测器。我可以成功提取车牌，但提取的车牌除了车牌号外还有一些不必要的像素/线。我的图像处理流程如下: 在灰度图像上应用 HOG 检测器裁剪检测到的区域调
python - 间隙填充轮廓/线
我有以下图片: 我想填充它的轮廓(即我想在这张图片中填充线条)。我尝试了形态学闭合，但使用大小为 3x3 的矩形内核和 10 迭代并没有填满整个边界。我还尝试了一个 21x21 内核和 1 迭代，但
algorithm - 统计两组序列的交点(线)
我必须找到一种算法，可以找到两组数组之间的交集总数，而其中一个数组已排序。举个例子，我们有这两个数组，我们向相应的数字画直线。这两个数组为我们提供了总共 7 个交集。有什么样的算法可以帮助我解决
c++ - 如何从带有透视投影的近裁剪平面绘制射线/线？
简单地说 - 我想使用透视投影从近裁剪平面绘制一条射线/线到远裁剪平面。我有我认为是使用各种 OpenGL/图形编程指南中描述的方法通过单击鼠标生成的正确标准化的世界坐标。我遇到的问题是我的光线似乎

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - Keras/Tensorflow中的类生成器(继承序列)线程安全吗？