python - 未设置 Tensorflow 恢复权重-6ren

python - 未设置 Tensorflow 恢复权重

转载作者：太空宇宙更新时间：2023-11-03 15:34:29

我正在尝试在 Tensorflow 中恢复我训练过的模型。问题是权重似乎没有正确恢复。

对于训练，我将权重和偏差定义为:

W = {
   'h1': tf.Variable(tf.random_normal([n_inputs, n_hidden_1]), name='wh1'),
   'h2': tf.Variable(tf.random_normal([n_hidden_1, n_hidden_2]), name='wh2'),
   'o': tf.Variable(tf.random_normal([n_hidden_2, n_classes]), name='wo')
}
b = {
   'b1': tf.Variable(tf.random_normal([n_hidden_1]), name='bh1'),
   'b2': tf.Variable(tf.random_normal([n_hidden_2]), name='bh2'),
   'o': tf.Variable(tf.random_normal([n_classes]), name='bo')
}

然后，我对自己的自定义 2D 图像数据集进行一些训练，并通过调用 tf.saver 保存模型

saver = tf.train.Saver()
saver.save(sess, 'tf.model')

后来我想用完全相同的权重恢复该模型，因此我像以前一样构建模型(也使用 random_normal 初始化)并调用 tf.saver.restore

saver = tf.train.import_meta_graph('tf.model.meta')
saver.restore(sess, tf.train.latest_checkpoint('./'))

现在，如果我打电话:

temp = sess.run(W['h1'][0][0])
print temp

我得到随机值，而不是权重的恢复值。

我在这方面画了一个空白，有人能指出我正确的方向吗？

仅供引用，我尝试过(没有)运气来简单地声明tf.Variable，但我不断得到:

ValueError: initial_value must be specified.

尽管 Tensorflow 本身声明应该可以简单地声明没有初始值( https://www.tensorflow.org/programmers_guide/variables 部分:恢复值)

更新1

当我按照建议运行时

all_vars = tf.global_variables()
for v in all_vars:
   print v.name

我得到以下输出:

wh1:0
wh2:0
wo:0
bh1:0
bh2:0
bo:0
wh1:0
wh2:0
wo:0
bh1:0
bh2:0
bo:0
beta1_power:0
beta2_power:0
wh1/Adam:0
wh1/Adam_1:0
wh2/Adam:0
wh2/Adam_1:0
wo/Adam:0
wo/Adam_1:0
bh1/Adam:0
bh1/Adam_1:0
bh2/Adam:0
bh2/Adam_1:0
bo/Adam:0
bo/Adam_1:0

这表明变量确实被读取了。然而调用

print sess.run("wh1:0")

导致错误:尝试使用未初始化的值 wh1

最佳答案

因此，在你们的帮助下，我最终将程序的保存和恢复部分分为两个文件，以确保没有初始化不需要的变量。

训练并保存例程fnn.py

def build(self, topology):
    """
    Builds the topology of the model
    """

    # Sanity check
    assert len(topology) == 4

    n_inputs = topology[0]
    n_hidden_1 = topology[1]
    n_hidden_2 = topology[2]
    n_classes = topology[3]

    # Sanity check
    assert self.img_h * self.img_w == n_inputs

    # Instantiate TF Placeholders
    self.x = tf.placeholder(tf.float32, [None, n_inputs], name='x')
    self.y = tf.placeholder(tf.float32, [None, n_classes], name='y')
    self.W = {
        'h1': tf.Variable(tf.random_normal([n_inputs, n_hidden_1]), name='wh1'),
        'h2': tf.Variable(tf.random_normal([n_hidden_1, n_hidden_2]), name='wh2'),
        'o': tf.Variable(tf.random_normal([n_hidden_2, n_classes]), name='wo')
    }
    self.b = {
        'b1': tf.Variable(tf.random_normal([n_hidden_1]), name='bh1'),
        'b2': tf.Variable(tf.random_normal([n_hidden_2]), name='bh2'),
        'o': tf.Variable(tf.random_normal([n_classes]), name='bo')
    }

    # Create model
    self.l1 = tf.nn.sigmoid(tf.add(tf.matmul(self.x, self.W['h1']), self.b['b1']))
    self.l2 = tf.nn.sigmoid(tf.add(tf.matmul(self.l1, self.W['h2']), self.b['b2']))
    logits = tf.add(tf.matmul(self.l2, self.W['o']), self.b['o'])

    # Define predict operation
    self.predict_op = tf.argmax(logits, 1)
    probs = tf.nn.softmax(logits, name='probs')

    # Define cost function
    self.cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits, self.y))

    # Adding these to collection so we can restore them again
    tf.add_to_collection('inputs', self.x)
    tf.add_to_collection('inputs', self.y)
    tf.add_to_collection('outputs', logits)
    tf.add_to_collection('outputs', probs)
    tf.add_to_collection('outputs', self.predict_op)

def train(self, X, Y, n_epochs=10, learning_rate=0.001, logs_path=None):
    """
    Trains the Model
    """
    self.optimizer = tf.train.AdamOptimizer(learning_rate).minimize(self.cost)

    costs = []

    # Instantiate TF Saver
    saver = tf.train.Saver()

    with tf.Session() as sess:
        sess.run(tf.global_variables_initializer())
        sess.run(tf.local_variables_initializer())

        # start the threads used for reading files
        coord = tf.train.Coordinator()
        threads = tf.train.start_queue_runners(sess=sess, coord=coord)

        # Compute total number of batches
        total_batch = int(self.get_num_examples() / self.batch_size)

        # start training
        for epoch in range(n_epochs):
            for i in range(total_batch):

                batch_xs, batch_ys = sess.run([X, Y])

                # run the training step with feed of images
                _, cost = sess.run([self.optimizer, self.cost], feed_dict={self.x: batch_xs,
                                                                           self.y: batch_ys})
                costs.append(cost)
                print "step %d" % (epoch * total_batch + i)
            #costs.append(cost)
            print "Epoch %d" % epoch

        saver.save(sess, self.model_file)

        temp = sess.run(self.W['h1'][0][0])
        print temp

        if self.visu:
            plt.plot(costs)
            plt.show()

        # finalize
        coord.request_stop()
        coord.join(threads)

预测例程fnn_eval.py:

with tf.Session() as sess:
        sess.run(tf.global_variables_initializer())
        sess.run(tf.local_variables_initializer())

        g = tf.get_default_graph()

        # restore the model
        self.saver = tf.train.import_meta_graph(self.model_file)
        self.saver.restore(sess, tf.train.latest_checkpoint('./tfmodels/fnn/'))

        wh1 = g.get_tensor_by_name("wh1:0")
        print sess.run(wh1[0][0])

        x, y = tf.get_collection('inputs')
        logits, probs, predict_op = tf.get_collection('outputs')

        coord = tf.train.Coordinator()
        threads = tf.train.start_queue_runners(sess=sess, coord=coord)

        predictions = []

        print Y.eval()

        for i in range(1):#range(self.get_num_examples()):
            batch_xs = sess.run(X)
            # Reshape batch_xs if only a single image is given
            #   (numpy is 4D: batch_size * heigth * width * channels)
            batch_xs = np.reshape(batch_xs, (-1, self.img_w * self.img_h))
            prediction, probabilities, logit = sess.run([predict_op, probs, logits], feed_dict={x: batch_xs})
            predictions.append(prediction[0])

        # finalize
        coord.request_stop()
        coord.join(threads)

关于python - 未设置 Tensorflow 恢复权重，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42635521/

文章推荐： python - 如何将元音的大写保持在同一位置？

文章推荐： javascript - 如何将动态值传递给字节数组

文章推荐： python - 有没有办法改变 strptime() 的阈值？

javascript - 恢复(更新，恢复)删除的元素
有什么方法可以恢复删除的元素吗？这是我删除元素的代码 myFunction() { var width = window.innerWidth; var February = doc
mysql - 恢复/恢复/重新创建 tokudb 表(从丢失的状态文件)
我有一个 TokuDB 表，由于某种原因缺少 ***_status.tokudb 文件。我还不确定文件是否由于 TokuDB 崩溃而丢失。问题是: 有没有办法从主要文件和关键文件(我可以从 tok
MySQL数据导入/恢复
我正在 Windows 7 (x86) 上运行带有 Workbench 6.3.8 的 32 位 MySQL Server 5.7.22 本地实例(必须选择 32 位版本 - 所以，较旧的版本)。我
ASP实现SQL备份、恢复
1、备份 <% SQL="backup database 数据库名 to disk='"&Serve
ASP中怎么实现SQL数据库备份、恢复！
1、ASP中怎么实现SQL数据库备份、恢复！答：asp在线备份sql server数据库： 1、备份 <% SQL="ba
恢复 R 中时间序列的线性滤波器
我在 R 中使用 stats::filter 函数来理解 R 中的 ARIMA 模拟(如在函数 stats::arima.sim 中)和估计。我知道 stats::filter 将线性过滤器应用于向量
ObjectBox - 数据库备份/恢复
我已经浏览了示例应用程序的文档和代码，并发现 files/objectbox/objectbox/data.mdb 是存储所有数据的默认文件。假设我的理解是正确的，我有几个问题找不到文档: 我想在我
ios - 不续订订阅 - 恢复
为了恢复非续订订阅类型的 InAppPurchase，我已经实现了服务器来处理此问题。但在购买过程中，iTunes 有时不会要求用户验证他们的卡详细信息，在这种情况下，它会在后台发送应用程序并显示
iphone - cocos2d游戏如何实现暂停/恢复？
我的问题是寻找cocos2d游戏期间暂停/恢复状态(包括所有需要保存的数据信息)的设计解决方案。包括但不限于以下情况: 1).用户选择退出，然后弹出一个对话框供用户选择“直接退出”、“暂停”； 2)
Mercurial 恢复/取消单个文件
在 Mercurial 中，我有一个旧的变更集，除了对单个文件的更改外，它都很好。我将如何恢复对该单个文件的更改？即使只是能够在上一个变更集中查看文件的状态也会很好，然后我可以剪切和粘贴。我的 M
Javascript 一键暂停/恢复
我的一项职能遇到了困难。我想做的是计时器在页面加载后立即启动，并且只有一个带有启动/恢复的按钮。我无法在代码中找出需要更改功能的位置。有人可以帮助我吗？谢谢! HTML: , Javascr
haskell - 恢复 do 表示法语法
我正在阅读Scrap your type classes 。这为类型类提供了替代方案。然而，我被Paul Chiusano的评论所困扰。其中讨论了恢复 do 表示法语法。坦白说，我无法理解 ret
非正常关闭后 OrientDB 恢复
当 OrientDB 因某人重新启动机器而非正常关闭时，OrientDB 最终会处于数据恢复失败的状态。对于如何从这种不正常的关闭中正常恢复有什么建议吗？我们正在寻找系统在断电期间能够自行恢复的方法。
渲染过程崩溃后的 Electron 恢复
我正在构建一个 Electron 应用程序，如果发生崩溃，它必须重新加载渲染进程窗口。目前我可以从主进程重新启动应用程序 app.relaunch(); app.quit(); 但我无法检测到窗口崩
java - 恢复 Activity
我有 3 个 Activity ，比如说 MainActivity、 Activity 2 和 Activity 3。在 MainActivity 中，我有一个按钮(开始/停止)，当我单击此按钮时，
ubuntu - 恢复 vimrc
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 11 年前。 Improve thi
Twilio 播放暂停/恢复
Twilio 是否支持暂停和恢复内容播放。换句话说，我有相当长的文件将播放给调用者，并且我正在尝试找到一种方法来实现暂停和恢复功能。在播放某些内容的过程中，我希望用户能够按数字暂停，然后再次按数字从音
Mercurial 恢复，然后重新应用变更集
我已经提交了 A、B、C、D 和 E。我意识到在提交 B 中发生了一些非常糟糕的事情，所以我想回到 A，这次正确地进行之前搞砸了 B 的更改，然后重新应用 C 、 D 和 E 自动。您可能想知道为什
PHPStorm 标记为(恢复)
我的一个文件被“标记为文本”，图标也发生了变化。实际上这是一个 PHP 文件。我尝试过使用 Help -> Find Action -> Mark As 尝试将其恢复为 PHP 突出显示，但它不起作用
c - SIGSEGV 恢复？
我有一些 SSE 程序，可以将循环中的内存归零，当指针未对齐时，它会引发 SIGSEGV进入我的处理程序。我可以在此类处理程序中获取更多信息吗例行公事，现在我不知道它是在哪里完成的，我也可以吗以某种可

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 未设置 Tensorflow 恢复权重