- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
问题1:我在递归神经网络上关注this tutorial,我想知道为什么需要在代码的以下部分中创建feed_dict
:
def run_epoch(session, model, eval_op=None, verbose=False):
state = session.run(model.initial_state)
fetches = {
"cost": model.cost,
"final_state": model.final_state,
}
if eval_op is not None:
fetches["eval_op"] = eval_op
for step in range(model.input.epoch_size):
feed_dict = {}
for i, (c, h) in enumerate(model.initial_state):
feed_dict[c] = state[i].c
feed_dict[h] = state[i].h
vals = session.run(fetches, feed_dict)
def run_epoch(session, model, eval_op=None, verbose=False):
fetches = {
"cost": model.cost,
"final_state": model.final_state,
}
if eval_op is not None:
fetches["eval_op"] = eval_op
for step in range(model.input.epoch_size):
vals = session.run(fetches)
feed_dict
被认为很慢。因此,建议使用
tf.data
API馈送数据。在这种情况下,使用
feed_dict
是否也是一个问题?如果是这样,在本示例中如何避免使用
feed_dict
。
feed_dict
的目的。但是,我不确定该教程中是否已实现。从你说的:
5
,将一个批处理中的数据点数设置为
24
,并将展开的RNN中的时间步数设置为< cc>。在这种情况下,您只能在
10
到
0
的时间点使用数据点。然后,分两个步骤(
20
)处理数据。当您遍历
model.input.epoch_size = 2
时:
state = session.run(model.initial_state)
# ...
for step in range(model.input.epoch_size):
feed_dict = {}
for i, (c, h) in enumerate(model.initial_state):
feed_dict[c] = state[i].c
feed_dict[h] = state[i].h
vals = session.run(fetches, feed_dict)
> Iteration (step) 1:
x:
[[ 0 1 2 3 4 5 6 7 8 9]
[ 24 25 26 27 28 29 30 31 32 33]
[ 48 49 50 51 52 53 54 55 56 57]
[ 72 73 74 75 76 77 78 79 80 81]
[ 96 97 98 99 100 101 102 103 104 105]]
y:
[[ 1 2 3 4 5 6 7 8 9 10]
[ 25 26 27 28 29 30 31 32 33 34]
[ 49 50 51 52 53 54 55 56 57 58]
[ 73 74 75 76 77 78 79 80 81 82]
[ 97 98 99 100 101 102 103 104 105 106]]
> Iteration (step) 2:
x:
[[ 10 11 12 13 14 15 16 17 18 19]
[ 34 35 36 37 38 39 40 41 42 43]
[ 58 59 60 61 62 63 64 65 66 67]
[ 82 83 84 85 86 87 88 89 90 91]
[106 107 108 109 110 111 112 113 114 115]]
y:
[[ 11 12 13 14 15 16 17 18 19 20]
[ 35 36 37 38 39 40 41 42 43 44]
[ 59 60 61 62 63 64 65 66 67 68]
[ 83 84 85 86 87 88 89 90 91 92]
[107 108 109 110 111 112 113 114 115 116]]
model.input.epoch_size
。因此,您假设在每一步都从头开始处理序列。这是对的吗?
最佳答案
Q1。在这种情况下,使用feed_dict
设置循环单元的初始状态。默认情况下,每次调用run
循环单元时,处理的数据都处于初始“零”状态。但是,如果序列很长,则可能需要将其分为几个步骤。在每个步骤之后,请务必保存循环单元的最终状态,并输入下一步的初始状态,这一点很重要,否则,就好像下一步又是序列的开始一样(尤其是如果输出只是处理完整个序列后网络的最终输出,就像丢弃最后一步之前的所有数据一样。在每个时期的开始,代码首先采用默认的“零状态”,然后继续执行循环,在该循环中,将当前状态设为初始状态,运行模型,并将输出状态设置为下一个新的当前状态迭代。
Q2。一般说来,“ feed_dict
慢”的说法可能会产生误导(我并不是怪您这么说,我也已经看过很多次了)。 feed_dict
的问题在于其功能是将非TensorFlow数据(通常为NumPy数据)带入TensorFlow世界。并不是说这很可怕,仅仅是需要花费一些额外的时间来移动数据,尤其是在涉及大量数据的情况下。例如,如果您想通过feed_dict
输入一批图像,则需要从磁盘加载它们,对其进行解码,将其转换为大的NumPy数组并将其传递给feed_dict
,然后TensorFlow将复制所有数据进入会话(GPU内存或其他);因此您将在内存中复制两个数据,并进行其他内存交换。 tf.data
之所以有帮助,是因为它在TensorFlow中完成了所有工作(这也减少了Python / C行程的次数,并且有时通常更方便)。在您的情况下,通过feed_dict
馈送的是循环单元的初始状态。除非您有几个相当大的循环层,否则我会说对性能的影响可能很小。不过,有可能在这种情况下也要避免feed_dict
,您需要拥有一组保存当前状态的TensorFlow变量,设置循环单元以将其输出用作初始状态(使用initial_state
参数并使用其最终状态来更新变量值;那么在每个新批次上,您将不得不再次将变量重新初始化为“零”状态。但是,我会确保在走那条路线之前这将有很大的好处(例如,即使结果不正确,也可以使用tf.nn.dynamic_rnn
和不使用feed_dict
来测量运行时间)。
编辑:
为了澄清更新,我在此处复制了代码的相关行:
state = session.run(model.initial_state)
fetches = {
"cost": model.cost,
"final_state": model.final_state,
}
if eval_op is not None:
fetches["eval_op"] = eval_op
for step in range(model.input.epoch_size):
feed_dict = {}
for i, (c, h) in enumerate(model.initial_state):
feed_dict[c] = state[i].c
feed_dict[h] = state[i].h
vals = session.run(fetches, feed_dict)
cost = vals["cost"]
state = vals["final_state"]
costs += cost
iters += model.input.num_steps
state
取值为
model.initial_state
,除非给出
feed_dict
替换其值,否则它将为默认的“零”初始状态值。
fetches
是稍后将传递给
session.run
的词典,因此它返回另一个词典,其中
"final_state"
键将保存最终状态值。然后,在每个步骤上,创建一个
feed_dict
,用
initial_state
中的数据替换
state
张量值,并使用该
run
调用
feed_dict
以检索
fetches
中的张量值。 ,然后
vals
保存
run
调用的输出。
state = vals["final_state"]
行用上次运行的输出状态替换了当前状态值
state
的内容;因此,在下一次迭代中,
feed_dict
将保留先前最后一个状态的值,因此网络将继续“好像”一次就给出了整个序列。在下一次对
run_epoch
的调用中,
state
将再次初始化为
model.initial_state
的默认值,并且该过程将再次从“零”开始。
关于python - 为什么在Tensorflow上的PTB教程中运行纪元时构造feed_dict?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49405965/
我正在做一个关于代码学院的教程,我在这里收到一个错误,说“看起来你的函数没有返回‘唉,你没有资格获得信用卡。资本主义就是这样残酷。’”当收入参数为 75 时。”但是该字符串在控制台中返回(由于某种原因
我正在阅读 Go 的官方教程,但很难理解 Channel 和 Buffered Channels 之间的区别。教程的链接是 https://tour.golang.org/concurrency/2和
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
作为 iOS 新手,有大量书籍可以满足学习基础知识的需求。现在,我想转向一些高级阅读,例如 OAuth 和 SQLite 以及动态 API 派生的 TableView 等。您可以推荐任何资源吗? 最佳
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题? 更新问题,以便 editing this post 可以用事实和引用来回答它. 关闭 8 年前。 Improve
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 8 年前。
前言 很多同学都知道,我们常见的CTF赛事除了解题赛之外,还有一种赛制叫AWD赛制。在这种赛制下,我们战队会拿到一个或多个服务器。服务器的连接方式通常是SSH链接,并且可能一个战队可能会同时有
Memcached是一个自由开源的,高性能,分布式内存键值对缓存系统 Memcached 是一种基于内存的key-value存储,用来存储小块的任意数据(字符串、对象),这些数据可以是数据库调用、A
Perl 又名实用报表提取语言, 是 Practical Extraction and Report Language 的缩写 Perl 是由 拉里·沃尔(Larry Wall)于19
WSDL 是 Web Services Description Language 的缩写,翻译成中文就是网络服务描述语言 WSDL 是一门基于 XML 的语言,用于描述 Web Services 以
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 6年前关闭。 Improve thi
我正在寻找解释在 WPF 中创建自定义用户控件的教程。 我想要一个控件,它结合了一个文本 block 、一个文本框和一个启动通用文件打开对话框的按钮。我已经完成了布局,一切都连接好了。它有效,但它是三
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我接近 fourth page of the Django tutorial 的开始看着vote查看,最后是这样的: # Always return an HttpResponseRedirect a
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
是否有任何好的 Qt QSS 教程,或者在某个地方我可以看到样式小部件的示例?如果某处可用,我想要一些完整的引用。除了有关如何设置按钮或某些选项卡样式的小教程外,我找不到任何其他内容。 最佳答案 Qt
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我是一名优秀的程序员,十分优秀!