gpt4 book ai didi

python - 如何使用 tensorflow 制作经过训练的模型的副本?

转载 作者:行者123 更新时间:2023-12-04 01:59:34 26 4
gpt4 key购买 nike

我有一个带有模型规范的类和一些训练和评估模型的方法。我想复制一个经过训练的对象,我尝试使用 copy.deepcopy()但没有用。

下面的代码只是一个例子,但我希望它适用于任何使用以下相同想法的模型:

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
import argparse
import sys
import copy
from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf
FLAGS = None

class Model():

def __init__(self):
self.x = tf.placeholder(tf.float32, [None, 784])
self.W = tf.Variable(tf.zeros([784, 10]))
self.b = tf.Variable(tf.zeros([10]))
self.y = tf.matmul(self.x, self.W) + self.b
self.y_ = tf.placeholder(tf.float32, [None, 10])
self.cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=self.y_, logits=self.y))
self.train_step = tf.train.GradientDescentOptimizer(0.5).minimize(self.cross_entropy)

def train(self, mnist, sess):
for _ in range(1000):
batch_xs, batch_ys = mnist.train.next_batch(100)
sess.run(self.train_step, feed_dict={self.x: batch_xs, self.y_: batch_ys})

def test(self, mnist, sess):
self.correct_prediction = tf.equal(tf.argmax(self.y, 1), tf.argmax(self.y_, 1))
self.accuracy = tf.reduce_mean(tf.cast(self.correct_prediction, tf.float32))
print(sess.run(self.accuracy, feed_dict={self.x: mnist.test.images, self.y_: mnist.test.labels}))

def main(_):
# Import data
mnist = input_data.read_data_sets(FLAGS.data_dir, one_hot=True)
m = Model()
sess = tf.InteractiveSession()
tf.global_variables_initializer().run()
m.train(mnist, sess)
copy_of_m = copy.deepcopy(m) # DOES NOT WORK !
m.test(mnist, sess)
copy_of_m.test(mnist, sess)

if __name__ == '__main__':
parser = argparse.ArgumentParser()
parser.add_argument('--data_dir', type=str, default='/tmp/tensorflow/mnist/input_data', help='Directory for storing input data')
FLAGS, unparsed = parser.parse_known_args()
tf.app.run(main=main, argv=[sys.argv[0]] + unparsed)

最佳答案

正如 de1 在评论中所解释的

TensorFlow variables exist in a graph and can't be serialised/desrialised on their own


您不能简单地复制 tensorflow模型使用 deepcopy因为 Variable s 住在一个图表中。虽然 Variable s 本身不能被复制(如果你复制它们,你会收到这个异常 TypeError: can't pickle _thread.RLock objects ), 您可以使用 __getstate__/__setstate__ 复制它们的值 .例如,
tf.reset_default_graph()

class Model():

def __init__(self):

self.normal = 2
self.x = tf.ones([1,2])
self.W = tf.Variable(tf.zeros([2, 2]))
self.b = tf.Variable(tf.zeros([2]))
self.y = tf.matmul(self.x, self.W) + self.b
self.train_step = tf.train.GradientDescentOptimizer(0.5).minimize(self.y)
self.inside_tf = ['W','b','x','y','train_step']

def __getstate__(self):

for item in self.inside_tf:
setattr(self,'%s_val' % item,sess.run(getattr(self,item)))
state = self.__dict__.copy()
for item in self.inside_tf:
del state[item]
return state

def __setstate__(self, state):

self.__dict__.update(state)

# Import data
m = Model()
sess = tf.InteractiveSession()
tf.global_variables_initializer().run()

copy_of_m = copy.deepcopy(m)
正如您通过运行此脚本所看到的,在酸洗之前(复制之前),在 __getstate__ 中方法,我们先保存 Variable的值s 然后从 self.__dict__ 的副本中删除它们.因此,在酸洗(复制)时,只有 Variable 的值s 将被腌制。
通过运行 [item for item in dir(copy_of_m) if item[:2] != '__'] ,可以看到对象 copy_of_m有属性 ['W_val', 'b_val', 'inside_tf', 'normal', 'train_step_val', 'x_val', 'y_val'] .虽然像 W_val 这样的属性不是 tensorflow Variable s,但很明显, Variable 的值s 对我们来说是最重要的事情。

关于python - 如何使用 tensorflow 制作经过训练的模型的副本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48264665/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com