python - 卷积神经网络内存使用情况-6ren

python - 卷积神经网络内存使用情况

转载作者：行者123 更新时间：2023-11-30 09:28:34

25

4

我正在实现一个 CNN。假设有 1000000 个训练样本，其中一层的尺寸为 20x30x30。

现在假设我必须计算这些示例的训练准确性。然后，在前向传播中，我需要为该层存储 1000000x20x30x30 = 180 亿个值，这占用了太多内存。另一方面，如果我分别对每个训练样本进行前向传播，则会花费太长时间。

我只是想知道如何解决这个问题？

非常感谢您所做的一切!

最佳答案

您在这里遇到的问题通常是通过批处理解决的(如评论中所述)。
您无需遍历所有训练示例，只需对数据点的子集进行采样，然后在仅查看这几个示例后更新权重。
与普通的“梯度下降”(GD) 相比，其名称为“随机梯度下降”(SGD)。随机性来自于使用随机子样本(通常是 2 的某个幂，即 4、8、16、32，...)。现在，我们不再进行简单的迭代，而是区分纪元(遍历所有训练数据)和简单迭代(仅使用 batch_size 元素)

这也回答了您在评论中提出的部分问题(“为什么一次提供更多图像更有效？”):由于您在每个批处理后更新权重(因此必须通过网络计算反向传播)，因此到达下一个前向传递将需要更长的时间。

一般来说，SGD 也是首选以获得更好的收敛性。在实践中，采取许多较小的步骤可能会比采取一个大的步骤产生更好的结果。如需更多引用，请参阅 this great lecture 中的最后几张幻灯片。 .

既然你担心它需要很长时间:具有适当批量大小的 SGD(我个人甚至不会超过每批 2^10 个样本；一些论文已经“设定了大约 128 个样本的标准”)可以得到你很快就能得到好的结果/收敛。为了可能更快的收敛，您牺牲了单次迭代的速度。

关于python - 卷积神经网络内存使用情况，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51712732/

25

4

0

文章推荐： java - 如何用java读取一个网站的源代码

文章推荐： java - 将 Guice Persist 与 JTA/bitronix 一起使用时出现问题

sql - 查询以处理单个参数以及 "All"情况
我正在创建一个 sql server 存储过程，它将输入作为逗号分隔的 productid 或选项“全部”。当用户传入逗号分隔的产品 ID 时，查询应输出所有产品 ID 的数据。我使用“IN”语句执行
scala - 模式匹配中的大量嵌套匹配...情况
我有一个自动生成的 Web 服务客户端。我有很多复杂的类，我必须对其进行模式匹配。现在我的结构如下所示: val response = client.getResponse response matc
声明全局变量的 Javascript 情况？
关闭。这个问题是opinion-based .它目前不接受答案。想改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 7年前关闭。 Improve this
sql - TSQL where 情况
我需要正确的 tsql 语法来解决这个问题: Select * from table where var_A='10' select * from table where var_B='10' 何时使
c - 尝试读取结构元素时的 if 情况
我遇到了这个问题。每当我运行程序并在需要时键入字母 m 时，我的 if 语句都不会识别它。有人知道为什么吗？我已经这样做了一个小时，但没有结果。 #include #include #includ
php - 为表格的特定行赋予颜色。情况
我从数据库列名称“你有护照”创建了一个表，用户回答是或否我如何将 css 应用到这个动态工作的表。 table, th, td { border: 1px solid black;
android - onStatusChanged 情况
我对 LocationListener 类的 onStatusChanged 有一些疑问。它知道它可以呈现三种状态:AVAILABLE、TEMPORARILY_UNAVAILABLE 和 OUT_O
delphi - 您如何命名和组织您的异常(exception)情况？
当引入新的异常类型时，我总是不确定如何正确地做到这一点。有共同约定吗？你怎么做呢？我对您组织它们的范围感兴趣(将它们保留在它们所使用的单元中？在组件级别有一个单元？包级别？应用程序？) 这也会影响命
sql - 营业时间逻辑和营业时间的异常(exception)情况
我使用以下内容创建了日期维度: https://www.codeproject.com/Articles/647950/Create-and-Populate-Date-Dimension-for-D
javascript - 如何全面查询类(class)情况？
您好，我正在使用 Android 完全 Kiosk 浏览器，该浏览器使用 chrome Webview。但是 javascript 中的某些方法或函数无法正常工作，例如 window.print()。
c# - 我应该处理哪些异常(exception)情况
我有以下代码: public void OpenFile(string FileName) { if (FileName == null)
java - 比较数据的异常(exception)情况
获取索引越界异常 for (int recordData = 0; recordData < recordDataList.size(); recordData++) {
JSF 渲染弹出窗口出现 manegbean 情况？
我使用它在发生错误时在登录中显示一条消息: × Invalid user or password
java - 比较异常(exception)情况
这是我的场景，我有一个异常列表，其中包含来自不同层次结构的任意异常，下面的代码快照将解释我需要做什么 private List connectionExceptions; try { // tryin
java - JTextPane 动态缩进!!!情况
我尝试动态更新 Jtextpane 中的左缩进。但我不能!这是我尝试过的! DefaultStyledDocument document = (DefaultStyledDocument) textp
java - 异常(exception)情况
我不知道为什么这个异常不起作用...... import java.util.*; public class a { public static void main(String[] args
mysql - MySQL 中联接内的多个 When 情况
我目前在 case 中使用多个 when 时遇到问题。当我删除第二个当时，它就起作用了。这是什么问题？报告的MYSQL错误为: #1064 - You have an error in your S
mysql - SQL:使用单个查询计算不同的 where 情况
例如，我有一个表记录用户查看和下载文件的事件， file_id user activity 2 Tim view 1 Ron
c++ - 令人困惑的 C++ 情况
这是一个非常愚蠢的问题，但我需要一点安慰/帮助。我有当前的“递归”情况: void add( int value ) { // do something ... // if ( conditi
javascript - 如何摆脱javascript中的绑定(bind)情况
我尝试使用以下代码在按钮数组上注册回调。但我似乎无法理解如何绑定(bind)回调中需要的字符串。任何建议将不胜感激! for (var i = 0; i < this.car_types.length

首页

博学

6Ren·AI

商城

python - 卷积神经网络内存使用情况