- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
在为图像分类任务训练卷积神经网络时,我们通常希望我们的算法学习将给定图像转换为正确标签的过滤器(和偏差)。我有几个模型,我试图在模型大小、操作次数、准确性等方面进行比较。但是,从 tensorflow 输出的模型的大小,具体是 model.ckpt.data存储图中所有变量值的文件不是我预期的文件。事实上,它似乎大了三倍。
为了直接解决问题,我将根据 this 提出问题木星笔记本。以下是定义变量(权重和偏差)的部分:
# Store layers weight & bias
weights = {
# 5x5 conv, 1 input, 32 outputs
'wc1': tf.Variable(tf.random_normal([5, 5, 1, 32]),dtype=tf.float32),
# 5x5 conv, 32 inputs, 64 outputs
'wc2': tf.Variable(tf.random_normal([5, 5, 32, 64]),dtype=tf.float32),
# fully connected, 7*7*64 inputs, 1024 outputs
'wd1': tf.Variable(tf.random_normal([7*7*64, 1024]),dtype=tf.float32),
# 1024 inputs, 10 outputs (class prediction)
'out': tf.Variable(tf.random_normal([1024, num_classes]),dtype=tf.float32)
}
biases = {
'bc1': tf.Variable(tf.random_normal([32]),dtype=tf.float32),
'bc2': tf.Variable(tf.random_normal([64]),dtype=tf.float32),
'bd1': tf.Variable(tf.random_normal([1024]),dtype=tf.float32),
'out': tf.Variable(tf.random_normal([num_classes]),dtype=tf.float32)
}
为了在训练过程结束时保存模型,我添加了几行:
# Save the model
save_path = saver.save(sess, logdir+"model.ckpt")
print("Model saved in file: %s" % save_path)
将所有这些变量加起来,我们希望得到一个大小为 12.45Mb 的 model.ckpt.data 文件(我通过计算我们的模型学习的浮点元素的数量获得了这个,然后将该值转换为兆字节)。但!保存的 .data 文件是 39.3Mb。这是为什么?
我对一个更复杂的网络(ResNet 的变体)采用了相同的方法,我预期的模型。数据大小也比实际 .data 文件小约 3 倍。
所有这些变量的数据类型都是float32。
最佳答案
Adding up all those variables we would expect to get a model.ckpt.data file of size 12.45Mb
传统上,大多数模型参数都在第一个全连接层中,在本例中为 wd1
。仅计算其大小会产生:
7*7*128 * 1024 * 4 = 25690112
... 或 25.6Mb
。注意 4
系数,因为变量 dtype=tf.float32
,即每个参数 4
字节。其他层也对模型大小有影响,但影响不大。
如您所见,您的估计值 12.45Mb
有点偏差(您是否为每个参数使用了 16 位?)。检查点还存储了一些通用信息,因此开销大约为 25%,这仍然很大,但不是 300%。
[更新]
所讨论的模型实际上具有形状为 [7*7*64, 1024]
的 FC1 层,正如已澄清的那样。所以上面计算出的大小确实应该是12.5Mb
。这让我更仔细地查看保存的检查点。
在检查之后,我注意到我原来错过的其他大变量:
...
Variable_2 (DT_FLOAT) [3136,1024]
Variable_2/Adam (DT_FLOAT) [3136,1024]
Variable_2/Adam_1 (DT_FLOAT) [3136,1024]
...
Variable_2
正好是 wd1
,但 Adam 优化器还有 2 个副本。这些变量由 the Adam optimizer 创建,它们被称为 slots 并保存 m
和 v
累加器所有可训练变量。现在总大小有意义了。
您可以运行以下代码来计算图形变量的总大小 - 37.47Mb
:
var_sizes = [np.product(list(map(int, v.shape))) * v.dtype.size
for v in tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES)]
print(sum(var_sizes) / (1024 ** 2), 'MB')
所以开销实际上很小。额外的大小是由于优化器造成的。
关于python - 学习变量的预期 tensorflow 模型大小,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47314011/
我对java有点陌生,所以如果我犯了一个简单的错误,请原谅我,但我不确定我哪里出错了,我收到的错误是“预期的.class,预期的标识符,而不是声明, ';'预期的。”我尝试了不同的方法,并从这些方法中
This question already has answers here: chai test array equality doesn't work as expected (3个答案) 3年前
我正在学习 Java(对不起,我的英语很差,这不是我的母语),当我在 Eclipse (JavaSE-1.7) 中在我输入的每个“try”中执行“try-finally” block 时,会出现以下消
我收到两个错误,指出 token 上的语法错误,ConstructorHeaderName expected instead & token “(”上的语法错误,< expected 在线: mTM.
我找不到错误。 Eclipse 给我这个错误。每个 { } 都是匹配的。请帮忙。 Multiple markers at this line - Syntax error on token “)”,
代码: import java.awt.*; import javax.swing.*; import java.awt.event.*; public class DoubleIt extends
我正在用 python(Vs 代码)编写代码,但出现此错误: Expected ")" Pylance 错误发生在:def main() 我试着运行我的 main 并将它打印到我的屏幕上。我用谷歌搜
我正在尝试按照 documentation 中的建议使用异步函数。但我收到此错误 意外的 token ,预期 ( async function getMoviesFromApi() { try
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。 想改善这个问题吗?更新问题,以便将其作为on-topic
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。 想改善这个问题吗?更新问题,以便将其作为on-topic
第一行包含一个表示数组长度的整数p。第二行包含用空格分隔的整数,这些整数描述数组中的每个元素。第三行打印一个整数,指示负数组的数量。 package asgn3; import java.util.*
好的,我是初学者,我必须修复此 java 表达式语言代码才能在我的系统 (Windchill) 中工作,但看起来我在语法中遗漏了一些内容: LWCNormalizedObject lwc =
我无法编译我的程序! 我想我缺少一个花括号,但我怎么也看不出在哪里! import javax.swing.*; import java.awt.*;
我的 jQuery 代码有问题,我的 Firebug 向我发出警告:需要选择器。 这是代码: $("img[id$='_tick']").each(function() { $(this).c
我的新类(class) Fountainofyouth 遇到了问题。尝试构建整个项目后,调试器显示 warning: extended initializer lists only available
我已经从 Java 转向 CPP,并且正在努力围绕构造构造函数链进行思考,我认为这是我的问题的根源。 我的头文件如下: public: GuidedTour(); GuidedTour(string
鉴于以下 for(var i=0; i< data.cats.length; i++) list += buildCategories(data.cats[i]); jsLint 告诉我 Expect
我有这个 json,但 Visual Studio Code 在标题中给了我警告。 [ { "title": "Book A", "imageUrl": "https:
我正在尝试编写一个有条件地禁用四个特殊成员函数(复制构造、移动构造、复制赋值和移动赋值)的包装类,下面是我用于测试目的的快速草稿: enum class special_member : uint8_
所以我用 F# 编写了一个非常简单的程序,它应该对 1000 以下的所有 3 和 5 的倍数求和: [1..999] |> List.filter (fun x -> x % 3 = 0 || x %
我是一名优秀的程序员,十分优秀!