- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在实现一个 CNN。假设有 1000000 个训练样本,其中一层的尺寸为 20x30x30。
现在假设我必须计算这些示例的训练准确性。然后,在前向传播中,我需要为该层存储 1000000x20x30x30 = 180 亿个值,这占用了太多内存。另一方面,如果我分别对每个训练样本进行前向传播,则会花费太长时间。
我只是想知道如何解决这个问题?
非常感谢您所做的一切!
最佳答案
您在这里遇到的问题通常是通过批处理解决的(如评论中所述)。
您无需遍历所有训练示例,只需对数据点的子集进行采样,然后在仅查看这几个示例后更新权重。
与普通的“梯度下降”(GD) 相比,其名称为“随机梯度下降”(SGD)。随机性来自于使用随机子样本(通常是 2 的某个幂,即 4、8、16、32,...)。现在,我们不再进行简单的迭代,而是区分纪元(遍历所有训练数据)和简单迭代(仅使用 batch_size
元素)
这也回答了您在评论中提出的部分问题(“为什么一次提供更多图像更有效?”):由于您在每个批处理后更新权重(因此必须通过网络计算反向传播),因此到达下一个前向传递将需要更长的时间。
一般来说,SGD 也是首选以获得更好的收敛性。在实践中,采取许多较小的步骤可能会比采取一个大的步骤产生更好的结果。如需更多引用,请参阅 this great lecture 中的最后几张幻灯片。 .
既然你担心它需要很长时间:具有适当批量大小的 SGD(我个人甚至不会超过每批 2^10 个样本;一些论文已经“设定了大约 128 个样本的标准”)可以得到你很快就能得到好的结果/收敛。为了可能更快的收敛,您牺牲了单次迭代的速度。
关于python - 卷积神经网络内存使用情况,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51712732/
我正在创建一个 sql server 存储过程,它将输入作为逗号分隔的 productid 或选项“全部”。当用户传入逗号分隔的产品 ID 时,查询应输出所有产品 ID 的数据。我使用“IN”语句执行
我有一个自动生成的 Web 服务客户端。我有很多复杂的类,我必须对其进行模式匹配。现在我的结构如下所示: val response = client.getResponse response matc
关闭。这个问题是opinion-based .它目前不接受答案。 想改进这个问题?更新问题,以便 editing this post 可以用事实和引用来回答它. 7年前关闭。 Improve this
我需要正确的 tsql 语法来解决这个问题: Select * from table where var_A='10' select * from table where var_B='10' 何时使
我遇到了这个问题。每当我运行程序并在需要时键入字母 m 时,我的 if 语句都不会识别它。有人知道为什么吗?我已经这样做了一个小时,但没有结果。 #include #include #includ
我从数据库列名称“你有护照”创建了一个表,用户回答是或否我如何将 css 应用到这个动态工作的表。 table, th, td { border: 1px solid black;
我对 LocationListener 类的 onStatusChanged 有一些疑问。 它知道它可以呈现三种状态:AVAILABLE、TEMPORARILY_UNAVAILABLE 和 OUT_O
当引入新的异常类型时,我总是不确定如何正确地做到这一点。有共同约定吗?你怎么做呢? 我对您组织它们的范围感兴趣(将它们保留在它们所使用的单元中?在组件级别有一个单元?包级别?应用程序?) 这也会影响命
我使用以下内容创建了日期维度: https://www.codeproject.com/Articles/647950/Create-and-Populate-Date-Dimension-for-D
您好,我正在使用 Android 完全 Kiosk 浏览器,该浏览器使用 chrome Webview。但是 javascript 中的某些方法或函数无法正常工作,例如 window.print()。
我有以下代码: public void OpenFile(string FileName) { if (FileName == null)
获取索引越界异常 for (int recordData = 0; recordData < recordDataList.size(); recordData++) {
我使用它在发生错误时在登录中显示一条消息: × Invalid user or password
这是我的场景,我有一个异常列表,其中包含来自不同层次结构的任意异常,下面的代码快照将解释我需要做什么 private List connectionExceptions; try { // tryin
我尝试动态更新 Jtextpane 中的左缩进。但我不能!这是我尝试过的! DefaultStyledDocument document = (DefaultStyledDocument) textp
我不知道为什么这个异常不起作用...... import java.util.*; public class a { public static void main(String[] args
我目前在 case 中使用多个 when 时遇到问题。当我删除第二个当时,它就起作用了。这是什么问题? 报告的MYSQL错误为: #1064 - You have an error in your S
例如,我有一个表记录用户查看和下载文件的事件, file_id user activity 2 Tim view 1 Ron
这是一个非常愚蠢的问题,但我需要一点安慰/帮助。我有当前的“递归”情况: void add( int value ) { // do something ... // if ( conditi
我尝试使用以下代码在按钮数组上注册回调。但我似乎无法理解如何绑定(bind)回调中需要的字符串。任何建议将不胜感激! for (var i = 0; i < this.car_types.length
我是一名优秀的程序员,十分优秀!