python - 批处理划分时 TensorFlow CNN 的行为有所不同-6ren

python - 批处理划分时 TensorFlow CNN 的行为有所不同

转载作者：行者123 更新时间：2023-12-01 03:52:16

30

4

最初我让 CNN 使用以下代码:

for i in range(1000):
    x_batch = []
    y_batch = []
    cost_ = 0.

    x_batch = x
    y_batch = y_data

    sess.run(train_op, feed_dict={X: x_batch, Y: y_batch, p_keep_conv: 0.8, p_keep_hidden: 0.5})
    cost_ += (sess.run(cost, feed_dict={X: x_batch, Y: y_batch, p_keep_conv: 0.8, p_keep_hidden: 0.5}))
    print(cost_)

但后来我意识到我无法使用更大的数据集，因为它会很快使用所有可用的内存。相反，我重写了代码，如下所示:

for i in range(1000):
    x_batch = []
    y_batch = []
    cost_ = 0.
    for i in range(0, len(y_data), 100):
        x_batch = x[i:i+100]
        y_batch = y_data[i:i+100]

        sess.run(train_op, feed_dict={X: x_batch, Y: y_batch, p_keep_conv: 0.8, p_keep_hidden: 0.5})
        cost_ += (sess.run(cost, feed_dict={X: x_batch, Y: y_batch, p_keep_conv: 0.8, p_keep_hidden: 0.5}))
    print(cost_)

它应该将输入分成批处理，以减少显卡使用的内存量。问题是现在它无法获得与以前相同的准确性。最初的准确率是 89%，现在只有 33%。

最佳答案

从梯度下降切换到随机梯度下降，您需要记住一些事情。

批量大小会影响神经网络的最终性能。我会尝试 128 或 256。

A typical minibatch size is 256, although the optimal size of the minibatch can vary for different applications and architectures.
您想使用较小的学习率，也许可以尝试结合学习率衰减。

learning rate α is typically much smaller than a corresponding learning rate in batch gradient descent because there is much more variance in the update.
您应该随机化每个时期的训练数据。

If the data is given in some meaningful order, this can bias the gradient and lead to poor convergence.

所有报价均来自 this article.可能值得进一步研究梯度下降和随机梯度下降之间的差异。

关于python - 批处理划分时 TensorFlow CNN 的行为有所不同，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38044706/

30

4

0

文章推荐： Python 追加未按预期工作

文章推荐： python - 选择 SFrame 中的特定行

文章推荐： javascript - 数组对象的属性测试不等于原始值

文章推荐： python - 如何优雅地解决Python KeyError(Python csv库)

C语言 block 划分
我在理解指针时遇到一些问题我有矩阵，然后我使用它将其分成小块 tiles_num = n /tile; // Allocate blocked matrix Ah = (REAL **) mall
awk 和 log2 划分
我有一个制表符分隔的文件，看起来像这样: foo 0 4 boo 3 2 blah 4 0 flah 1 1 我正在尝试计算每行两列之间的 log2。我的问题是除以零我试过的是这样的: cat fi
java - 划分 BigDecimals 时保留中间结果的最大精度
在返回最终结果之前，我使用 BigDecimal 进行了几次计算。我的计算包含两个部分。我知道我应该在调用 divide() 时定义缩放和舍入模式。但是，由于我使用的是货币，所以我想尽可能长时间地保持
delphi - ASM/德尔福 - 划分
我正在尝试将两个数字 50 和 5 相除。这是我的代码: function Divide(Num1, Num2: Integer): Integer; asm MOV EAX, Num1
r - R中的加拿大人口普查 map 划分
我对 R 和映射非常陌生，我想创建某些数据的映射。我有一组名为“D.Montreal”的数据，它显示了 2010 年访问蒙特利尔的加拿大人口普查部门的访客。我想使用这些数据创建一张 map ，以显示有
R 条形图与 bin 划分
我需要制作一个条形图，将数据分为多个 bin。我的数据如下所示: 1.0 5 1.2 4 2.4 1 4.3 6 5.2 10 然后在X轴上我想有时间的值，比如:[1-4)、[4-5)等(取决于cs
C# 后台 worker 划分
我正在尝试使用一个后台 worker ，它为字典中的每个键将内容保存到文件中。 ACon 是一个个人类，它在其中调用字典内容的保存函数。 private void bwSaver_DoWork(
java - 划分 ArrayLists 输出
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求提供代码的问题必须表现出对所解决问题的最低限度理解。包括尝试过的解决方案、为什么它们不起作用，以及预
java - 矩阵 -> block 划分
我想将一些矩阵加载到我的程序中，然后我想将它分成更小的 block 。我想要的确切内容可以在下面的图片中看到: http://postimg.org/image/aki19hjx9/ba463111/
javascript - 划分 anchor 字符串值？
我有一个 anchor ，我将其注入(inject)到 jqGrid 格式化程序中的 HTML 中，如下所示: var number = rowObject.number; var plateNumb
javascript - 传单弹出窗口和标签超出 map 划分
我在传单标记上使用弹出窗口，并使用背景作为固定大小的图像。每当标记放置在 map 的一 Angular ，然后我单击标记以显示弹出窗口时，它会稍微移动整个 map 几分之一秒，然后弹出消息会超出 ma
python - 如何根据条件对列表进行分区(拆分、划分)？
我有一些代码，例如: good = [x for x in mylist if x in goodvals] bad = [x for x in mylist if x not in goodvals
c# - 划分 WPF 窗口
我想将我的窗口 (wpf) 分成三列:左列必须是 DockPanel(我认为 StackPanel 在 Canvas), 右栏应该是另一个 DockPanel 包含一个 listbox 并且在中间我需
php - 划分 foreach 不能正常工作
我有按国家/地区划分城市列表的代码: query('SELECT `city`, `country` FROM `cities` ORDER BY `id` ASC'); $cities->execu
css - 划分 Bootstrap 网格列的最佳方法
我已经划分了我的Bootstrap网格列如下。 A B1 B1.1
asp.net - 划分 web.config
我正在开发一个 asp.net 项目，但我还没有很长的 web.config 文件(超过 400 行)。但是有了这个 nhibernate log4net 和 urlrewrites。它越来越大。有没
cocoa - 使用 NSArrayController 划分 NSTableView
我正在尝试使用 NSArrayController 和 cocoa 绑定(bind)创建分段的 NSTableView。我正在寻找类似的方法，例如 iOS 中的 NSFetchedResultsCon
c# - 划分/移动 assembly 差异
早上好，下午好，还是晚上好，在查看关闭“抑制 JIT 优化 (...)”选项的调试构建的汇编代码后，我注意到以下奇怪的行为(bitCount 是 ulong): int BitQ
swift - 划分 UITableView 单元格 - 重复单元格
我正在尝试根据 Firebase 数据库中的键对 Tableview 数据进行分段。我能够根据键 (itemPreset) 正确划分所有内容。我在将可重用单元分配到其部分时遇到问题。单元格不断重
Lodash Wrapper 对象上的 Javascript 划分
我最近升级到 Lodash 3.10.1我注意到了一些奇怪的事情。假设我有一个数字数组，我想得到数组中的最大值然后减半: var series = [ 6, 8, 2 ]; var highestT

首页

博学

6Ren·AI

商城

python - 批处理划分时 TensorFlow CNN 的行为有所不同