tensorflow 数据集 shuffle 然后批处理或批处理然后 shuffle-6ren

tensorflow 数据集 shuffle 然后批处理或批处理然后 shuffle

转载作者：行者123 更新时间：2023-12-04 13:36:34

29

4

我最近开始学习 tensorflow。

我不确定是否有区别

x = np.array([[1],[2],[3],[4],[5]])
dataset = tf.data.Dataset.from_tensor_slices(x)
ds.shuffle(buffer_size=4)
ds.batch(4)

和

x = np.array([[1],[2],[3],[4],[5]])
dataset = tf.data.Dataset.from_tensor_slices(x)
ds.batch(4)
ds.shuffle(buffer_size=4)

另外，我不确定为什么我不能使用

dataset = dataset.shuffle_batch(buffer_size=2,batch_size=BATCH_SIZE)

因为它给出了错误

dataset = dataset.shuffle_batch(buffer_size=2,batch_size=BATCH_SIZE)
AttributeError: 'TensorSliceDataset' object has no attribute 'shuffle_batch'

谢谢!

最佳答案

TL;DR: 是，有一点不同。几乎总是，您会想调用 Dataset.shuffle() 之前 Dataset.batch() .没有shuffle_batch() tf.data.Dataset 上的方法类，并且您必须分别调用这两个方法来对数据集进行混洗和批处理。
tf.data.Dataset 的转换以与调用它们相同的顺序应用。 Dataset.batch()将其输入的连续元素组合成输出中的单个批处理元素。
通过考虑以下两个数据集，我们可以看到操作顺序的效果:

tf.enable_eager_execution()  # To simplify the example code.

# Batch before shuffle.
dataset = tf.data.Dataset.from_tensor_slices([0, 0, 0, 1, 1, 1, 2, 2, 2])
dataset = dataset.batch(3)
dataset = dataset.shuffle(9)

for elem in dataset:
  print(elem)

# Prints:
# tf.Tensor([1 1 1], shape=(3,), dtype=int32)
# tf.Tensor([2 2 2], shape=(3,), dtype=int32)
# tf.Tensor([0 0 0], shape=(3,), dtype=int32)

# Shuffle before batch.
dataset = tf.data.Dataset.from_tensor_slices([0, 0, 0, 1, 1, 1, 2, 2, 2])
dataset = dataset.shuffle(9)
dataset = dataset.batch(3)

for elem in dataset:
  print(elem)

# Prints:
# tf.Tensor([2 0 2], shape=(3,), dtype=int32)
# tf.Tensor([2 1 0], shape=(3,), dtype=int32)
# tf.Tensor([0 1 1], shape=(3,), dtype=int32)

在第一个版本中(洗牌前的批处理)，每批处理的元素是输入中的 3 个连续元素；而在第二个版本中(批处理前洗牌)，它们是从输入中随机采样的。通常，当通过(某些变体)小批量 stochastic gradient descent 进行训练时，每个批处理的元素应该从总输入中尽可能均匀地采样。否则，网络可能会过度拟合输入数据中的任何结构，并且生成的网络将无法达到如此高的精度。

关于tensorflow 数据集 shuffle 然后批处理或批处理然后 shuffle，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50437234/

29

4

0

文章推荐： polymer - 如何使用 LitElement 观察属性变化

文章推荐： reactjs - 返回的 React Custom Hook set 函数不是函数

文章推荐： arrays - perl6 : Array; get rid of empty slot (Any)

后藤此时出乎意料——批处理
我正在尝试制作一个基于文本的批处理游戏。但是我刚开始写我以前从未遇到过的问题时遇到了一个问题。 :menu :: the game menu - opens when the game starts
PHP 批处理
我正在构建一个社交媒体应用程序，用户需要发布一些内容，然后将发布的内容传播给他/她的 4 个圈子内的所有成员。这意味着查询进入循环。它就像一个家谱。逻辑工作得很好。但现在，当每个圈子中的成员数量不断增
批处理动态sql
１. DECLARE TYPE ref_cursor_type IS ref CURSOR; v_mycursor ref_cursor_type;
loops - [批处理]循环直到按下一个键
我想在这里做的是循环直到按下“x”。我知道 CHOICE 带有 /T 选项。但是 CHOICE 对我要播放的动画的超时时间太长。这是一个例子: @echo off cls set frame=2 :
string - 批处理，比较两个文件并将差异写入另一个文件
我已经寻找解决方案，但我仍然遇到问题。我有两个文件: File1.txt 1111 2222 3333 File2.txt 1111 2222 3333 4444 我想要一个只有差异的输
regex - 批处理 - 将变量与正则表达式进行比较
我正在做一个批处理脚本，必须检查计算机上是否安装了一些程序。为此，我执行 programName --version我将输出存储在一个变量中。问题是当我尝试与正则表达式进行比较时(只知道该程序是否存在
function - 批处理 - 如何从批处理文件中返回一个值？
我知道如何从同一个批处理文件中的函数返回值，但我发现从不同的批处理文件返回值时存在一些问题。下面是一个例子: 文件 1.cmd SETLOCAL ENABLEEXTENSIONS SETLOCAL E
arrays - 批处理 - 从数组中删除元素
我相信这个问题的答案应该很简单。我从一个地方获取目录列表并将它们存储到文本文档中。然后我读取文本文档名称并将它们存储到一个数组中。在此过程结束时，我希望删除数组中的所有条目。我想这样做的原因是因为我
windows - 批处理-FTP删除文件夹早于
我家有两个摄像头，几乎每天都在创建图像。他们将它们保存到我的FTP服务器(Fritz.Box\Nas驱动器)。文件夹结构如下: +-2016-08-24 +-+Subfolder +----+Ano
windows - 如何检查输入是否已在列表中-批处理
在Windows Batch中执行此操作。我有一个名称列表，并要求用户输入其名称。我想检查该名称是否已经存在于列表中，如果存在，则直接进入goto，否则它将名称添加到列表中。 @echo off s
windows - 批处理 For 循环以获取第一个值
我正在编写一个批处理文件，我想运行一个 for 循环，将它的第一个值设置为一个变量。我只需要命令的第一个值，但我找不到另一种方法来做到这一点。我设置它的方式是使用一个 for 循环，然后是一个 do
file - 批处理 - 有没有办法批量同步锁定txt文件？
我需要创建一个批处理文件，使用tracert命令跟踪一些IP，并将跟踪写入txt文件。我希望它很快，所以我想为每个跟踪启动一个新命令，以使所有跟踪请求立即启动。这是我的 ping.bat: @ech
powershell - 转义序列问题-批处理
我想在批处理文件中使用PowerShell命令发送电子邮件。为此，我实现了一个名为 sendMail 的函数。我这样称呼它: setlocal enabledelayedexpansion call:
java - 如何使用java执行selenium脚本/批处理
想要使用 java 执行 selenium 脚本/批处理脚本。根据输入参数调用脚本/批处理脚本。了解如何使用 java 代码运行脚本/批处理。请帮帮我。最佳答案要运行 java 项目中文件中包
java - 批处理 JDBC
我正在练习 JDBC 批处理并遇到错误: 错误1:不支持的功能错误2:执行不能为空或为null Property files include: itemsdao.updateBookName = Up
string - 批处理 - 从字符串中删除最后一个字符
我从 json 文件中得到了以下字符串: 39468856, 现在，我想用这些数字进行计算..因此，我必须删除末尾的 , 。此时我使用以下代码: for /f "skip=24 tokens=2"
sql - sql文件的执行时间-批处理
我有一堆 SQL 查询作为文件存储在磁盘上。它们都是纯 SELECT 查询，换句话说，它们只做读操作。我正在连接到 Oracle 11g 数据库，我想测量所有这些查询的大致执行时间。有没有办法以编
java - 批处理 - 从属性文件读取文件路径时出错
我正在使用 java 来存储属性文件的目录路径。然后在 bat 文件中我使用属性作为变量。问题出在 Java 中，文件路径存储为 SOME_VAR=D\:\\Madhan\\Program Fil
string - 批处理 - 用百分比符号替换
我想用“%”替换字符串中的“mod”:set string=%string:mod=x%我应该输入什么作为“x”？最佳答案您可以通过启用延迟扩展来做到这一点，以便您可以使用 !作为分隔符。然后，将
variables - 批处理 - 在另一个变量中回显变量的值？
在我目前正在处理的批处理文件中，我遇到了一个小问题。我有一个名为 Dimensions(number from 1-5, defined in a for /l loop).txt 的文件，其中包含

首页

博学

6Ren·AI

商城

tensorflow 数据集 shuffle 然后批处理或批处理然后 shuffle