tensorflow - 在 TensorFlow 中微调 Inception 模型-6ren

tensorflow - 在 TensorFlow 中微调 Inception 模型

转载作者：行者123 更新时间：2023-12-03 16:27:03

26

4

我想在我自己的数据集上使用预训练的 Inception 模型，并且我还想微调 Inception 模型本身的变量。

我已经从以下链接下载了 TensorFlow 的预训练 Inception 模型:

http://download.tensorflow.org/models/image/imagenet/inception-2015-12-05.tgz

我按如下方式加载 Inception 模型:

graph = tf.Graph()
with graph.as_default():
    with tf.gfile.FastGFile('classify_image_graph_def.pb', 'rb') as file:
        graph_def = tf.GraphDef()
        graph_def.ParseFromString(file.read())
        tf.import_graph_def(graph_def, name='')

(关于 API 的附注:如果我可以写 graph = tf.load_graph('inception.pb') 而不是这六个嵌套和复杂的行，那就太好了。)

然后我得到对 Inception 模型中 softmax 分类器之前最后一层的张量的引用:

last_layer = graph.get_tensor_by_name('pool_3:0')

现在我想在图中添加一个新的 softmax 分类器，这样我就可以训练新的 softmax 分类器并训练 Inception 模型中的部分或全部变量。这就是我所理解的微调，而不是迁移学习，只有新的 softmax 分类器在我自己的数据集上进行训练。

然后我使用 PrettyTensor 附加新的 softmax 分类器(注意 y_true 是一个占位符变量):

with pt.defaults_scope(activation_fn=tf.nn.relu):
    y_pred, loss = pt.wrap(last_layer).\
        flatten().\
        softmax_classifier(class_count=10, labels=y_true)

但这会给出一个很长的错误消息，最后一部分显示为:

ValueError: Tensor("flatten/reshape/Const:0", shape=(2,), dtype=int32) must be from the same graph as Tensor("pool_3:0", shape=(1, 1, 1, 2048), dtype=float32).

所以我显然不允许像这样组合两个图表。

我也尝试过使用 reshape()而不是 flatten()如下(注意Inception模型的最后一层有2048个特征):

with pt.defaults_scope(activation_fn=tf.nn.relu):
    y_pred, loss = pt.wrap(last_layer).\
        reshape([-1, 2048]).\
        softmax_classifier(class_count=10, labels=y_true)

但这给出了几乎相同的错误:

ValueError: Tensor("reshape/Const:0", shape=(2,), dtype=int32) must be from the same graph as Tensor("pool_3:0", shape=(1, 1, 1, 2048), dtype=float32).

我也尝试将它包装在 graph.as_default() 中像这样:

with graph.as_default():
    with pt.defaults_scope(activation_fn=tf.nn.relu):
        y_pred, loss = pt.wrap(last_layer).\
            reshape([-1, 2048]).\
            softmax_classifier(class_count=10, labels=y_true)

但这给出了类似的错误:

ValueError: Tensor("ArgMax_1:0", shape=(?,), dtype=int64) must be from the same graph as Tensor("cross_entropy/ArgMax:0", shape=(1,), dtype=int64).

我将如何对 Inception 模型进行微调？我想添加一个新的 softmax 分类器，并且我想微调 Inception 模型本身中的部分或全部变量。

谢谢!

编辑:

我对这个问题有部分解决方案。

错误消息是因为我没有将所有代码放入 with graph.as_default():堵塞。将所有代码放入该 block 中可修复错误消息，我现在可以使用 PrettyTensor 将新的 softmax 层附加到 Inception 模型，如上所述。

但是，Inception 模型显然是一个“卡住”图，这意味着所有变量在保存之前都已转换为常量。

所以我现在的问题是，我是否可以以某种方式“解冻”初始模型的图形，以便继续训练其图形的部分或全部变量？我该怎么做？

还是应该改用新的 MetaGraph 功能？

https://www.tensorflow.org/versions/r0.11/how_tos/meta_graph/index.html

我在哪里可以下载 Inception 模型的预训练 MetaGraph？

最佳答案

我也有完全相同的问题。首先你可以根据这个微调整个网络:https://github.com/tensorflow/models/tree/master/inception#adjusting-memory-demands
我想出了如何在我自己的数据集上实现这个代码。问题是我想微调整个网络，然后用新的卷积层和 softmax 替换最后 2 个初始模块。但是，我认为如果我进行整个微调，那么我需要恢复权重直到第 8 个初始模块并只训练新层，但这不能仅通过 tensorflow 的恢复功能来实现。另一个好技巧在这里:https://www.tensorflow.org/versions/r0.9/how_tos/image_retraining/index.html
您可以从 .pb 文件中获取预训练网络，但这仅适用于根据 tensorflow 进行的迁移学习。我想到的唯一解决方案是对整个网络进行微调，然后将其导出到 .pb 文件，以便将微调的权重带到我想要的层，但我无法实现这一点。通常 tensorflow 并不清楚我们如何做到这一点。我也会在 git 上发布一个问题。如果有人确切知道我们可以做什么，请回答。

关于tensorflow - 在 TensorFlow 中微调 Inception 模型，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39996575/

26

4

0

文章推荐： objective-c - 指针后空格的编码约定 *

文章推荐： objective-c - 创建 NSManagedObjectContext 以在线程中使用

文章推荐： visual-studio-code - 如何同时显示输出窗口和调试控制台？

Mysql - 微调 HAVING
有没有人对如何解决这个查询有任何想法？有一张客户表和一张许可证表。每个客户可以有多个在不同时间到期的许可证，一些已经过期，一些还没有。如果我想选择至少拥有一个有效许可证的所有客户，我会这样做: SE
tensorflow - 微调 Blenderbot
我一直在尝试微调 HuggingFace: Blendebot 的对话模型。我已经尝试过拥抱脸官方网站上给出的常规方法，它要求我们使用 trainer.train() 方法来完成。我也尝试过使用 .c
Javascript 微调 + 查找名称的精确匹配
是否有内置的 JavaScript 字符串方法可以帮助我微调这段代码以确保它只找到与名称完全匹配的内容？这是我的代码。 /*jshint multistr:true */ var text = "S
python - Wor2vec 微调
我需要微调我的 word2vec 模型。我有两个数据集，data1 和 data2。到目前为止我所做的是: model = gensim.models.Word2Vec( data1
iOS UIScrollView 微调
在苹果的应用程序中，我注意到滚动效果非常完美。一切都进展顺利，当你停下来时，它就停止了。您可以拥有一个巨大的图像并直接移动到任何位置，并且它会停留在那里。我想提供相同的 UE，但对于我的应用程序，如
tensorflow - Huggingface 微调——如何在预训练的基础上构建自定义模型
问题请帮助理解以下问题的原因以及如何构建 Keras 模型以在 huggingface 的预训练模型之上进行微调。目标在 TFDistilBertForSequenceClassificatio
r - 微调 R 的点阵包中的点图
我正在尝试为不同的数据集和不同的算法绘制一堆 ROC 区域。我有三个变量:“Scheme”指定使用的算法，“Dataset”是测试算法的数据集，以及“Area_under_ROC”。我在 R 中使
tensorflow - 微调 Keras 模型
我正在使用 CNN 进行面部表情识别。我使用 Keras 和 Tensorflow 作为后端。我的模型保存为 h5 格式。我想重新训练我的网络，并使用 VGG 模型微调我的模型。我如何使用 ker
cocoa - 微调 NSTextField 自动完成
我正在使用 NSControlTextEditingDelegate 自动完成内容在 NSSearchField 中输入我生成的自定义建议。complete: 消息发送到字段编辑器当文本更改时。现在
python - 微调 mnist 深度自动编码器模型
我为 mnist 数据集开发了一个 3 层深度自动编码器模型，因为我只是这个微调范例的初学者，所以我正在练习这个玩具数据集下面是代码 from keras import layers from k
c++ - 微调 == 运算符以匹配 double
在我的代码中有一个我正在计算的参数。在多次测试中，该参数应该为0。由于该参数是通过多次加减计算的，因此不完全为0，而是小于10^-10。目前我正在使用: double tol = pow(10,-10
android - 微调 onitemclicklistener 不工作
我的应用程序中有一个微调器，但在单击某个项目时它不起作用。我得到了值，但 if 条件不起作用。 spinner.setOnItemSelectedListener(new AdapterView.On
mysql - 微调 MySQL 服务器配置以获得更好的性能
我需要帮助调整我的 mysql 服务器以获得更好的性能。我有很多资源，但它仍然表现不佳。我打得最多的一张表只有350万条记录。我需要帮助关注更改哪些设置以获得更好的性能。像这样的简单查询 SELE
python - Keras VGG16 微调
在keras blog上有一个VGG16微调的例子，但我无法重现它。更准确地说，这里是用于在没有顶层的情况下初始化 VGG16 并卡住除最顶层以外的所有 block 的代码: WEIGHTS_PAT
android - 微调 Activity 不工作
我正在尝试创建一个 Activity RateCardActivity，其中有一个微调器。 RateCardActivity 的布局文件是 rate_card。我的 RateCardActivity
android - 微调 View ；选择器不工作
微调器 xml: 我试过使用 android:background=... 自己购买，使用 dropDownSelector，使用和不使用 listSelector=...; 使用和不使用 list
用于列出组成员的 Windows PowerShell 命令 - 微调
我精心制作了下面列出组成员的命令: gwmi win32_group -filter 'Name="Administrators"'|%{$_.GetRelated('Win32_UserAccoun
performance - 微调 HTML5 Phonegap 应用程序
已成功构建 HTML5 应用程序。以下库用于此: jquery.mobile-1.1.1.min.js jquery.mobile-1.1.1.min lawnchair.js 一切正常用 Phone
python - Keras:微调 Inception 时精度下降
我在使用 Keras 微调 Inception 模型时遇到问题。我已经成功地使用教程和文档生成了一个完全连接的顶层模型，该模型使用 Inception 中的瓶颈特征将我的数据集分类到正确的类别中，准
nlp - 微调 DistilBertForSequenceClassification : Is not learning, 为什么损失没有改变？权重没有更新？
我对 PyTorch 和 Huggingface-transformers 比较陌生，并在此 Kaggle-Dataset 上试验过 DistillBertForSequenceClassificat

首页

博学

6Ren·AI

商城

tensorflow - 在 TensorFlow 中微调 Inception 模型