- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在 Tensorflow 的 RNN 教程中:https://www.tensorflow.org/tutorials/recurrent
.它提到了两个参数:批量大小和时间步长。我对这些概念感到困惑。在我看来,RNN 引入批处理是因为 to-train 序列可能很长,以至于反向传播无法计算那么长(爆炸/消失梯度)。所以我们将长的 to-train 序列分成更短的序列,每个序列都是一个 mini-batch,其大小称为“batch size”。我就在这里吗?
关于时间步长,RNN 仅由一个单元(LSTM 或 GRU 单元,或其他单元)组成,并且该单元是连续的。我们可以通过展开它来理解顺序概念。但是展开顺序单元是一个概念,不是真实的,这意味着我们不会以展开的方式实现它。假设要训练的序列是一个文本语料库。然后我们每次向 RNN 单元输入一个单词,然后更新权重。那么为什么我们在这里有时间步长呢?结合我对上面“批量大小”的理解,我更加困惑了。我们给单元格输入一个词还是多个词(批量大小)?
最佳答案
批次大小与每次更新网络权重时要考虑的训练样本量有关。因此,在前馈网络中,假设您想根据一次从一个单词计算梯度来更新网络权重,您的 batch_size = 1。
由于梯度是从单个样本计算的,因此在计算上非常便宜。另一方面,这也是非常不稳定的训练。
要了解在训练这种前馈网络期间会发生什么,
我会给你推荐这个very nice visual example of single_batch versus mini_batch to single_sample training .
但是,您想了解 num_steps 变量会发生什么。这与您的 batch_size 不同。您可能已经注意到,到目前为止,我已经提到了前馈网络。在前馈网络中,输出由网络输入确定,输入-输出关系由学习到的网络关系映射:
hidden_activations(t) = f(input(t))
输出(t) = g(hidden_activations(t)) = g(f(input(t)))
在大小为 batch_size 的训练过程之后,将计算您的损失函数相对于每个网络参数的梯度并更新您的权重。
然而,在循环神经网络 (RNN) 中,您的网络功能略有不同:
hidden_activations(t) = f(input(t), hidden_activations(t-1))
输出(t) = g(hidden_activations(t)) = g(f(input(t), hidden_activations(t-1)))
=g(f(input(t), f(input(t-1), hidden_activations(t-2)))) = g(f(inp(t), f(inp(t-1), ... , f(inp(t=0), hidden_initial_state))))
正如您可能从命名意义上推测的那样,网络保留了其先前状态的内存,并且神经元激活现在也依赖于先前的网络状态,进而依赖于网络曾经发现自己所处的所有状态。大多数 RNN使用健忘因子以更加重视最近的网络状态,但这不是您问题的重点。
然后,正如您可能猜测的那样,如果您必须考虑自网络创建以来所有状态的反向传播,计算损失函数相对于网络参数的梯度在计算上非常非常昂贵,有一个巧妙的小技巧加快计算速度:使用历史网络状态 num_steps 的子集来近似梯度。
如果这个概念讨论还不够清楚,你也可以看看 more mathematical description of the above .
关于recurrent-neural-network - 关于 RNN 中批量大小和时间步长的疑问,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44381450/
我正在使用AWS中的VM设置Elasticsearch集群。 我知道每个节点都会自动尝试加入一个在同一网络中具有相同群集名称的现有群集。 但是,我无法理解“同一网络” 是什么。 为了了解同一网络,我发
我尝试部署一个已经存在于 Kovan 网络上的合约实例,以通过 web3 和 metamask 与其交互。 首先,我将 metamask 设置为我的当前提供者,然后我部署了一个合约实例,如下所示:
停止 docker 后,它拒绝重新启动。它提示另一个名为 docker0 的网桥已经存在: level=warning msg="devmapper: Base device already exis
我正在使用“docker network create --d bridge mynet”创建一个 docker 网络。我想获取与此 docker 网络关联的网桥名称。 我知道我可以使用“-o”来提供
我的一位同事的VPN连接有问题。似乎他的操作系统重设了代理设置,并且他需要手动将其更改回。有没有办法使用Powershell设置VPN和代理? 他正在使用Windows 7,因此可以使用Powersh
我在 Azure VM 中有一个虚拟机,我想获取网络输入/网络输出指标。 在 Azure 门户中,我将诊断设置和指标设置为存储到选定的存储表中。但存储的指标与我在 Azure 门户中看到的指标之间存在
我有一个用例,我的 Docker 容器的第二个接口(interface)需要共享主机的第二个网络接口(interface)的接口(interface)。这可能使用 docker network con
我在 Azure VM 中有一个虚拟机,我想获取网络输入/网络输出指标。 在 Azure 门户中,我将诊断设置和指标设置为存储到选定的存储表中。但存储的指标与我在 Azure 门户中看到的指标之间存在
我想了解一些关于 Docker 的事情: 如何找到我的容器所在的网络? 我可以动态分离我的容器并附加到其他网络吗?怎么样? 如果我有两个容器正在运行,如何检查这两个容器是否在同一个网络?我可以 pin
我已经开发了一款使用Reaction Native和世博会的应用程序,并想在它的末尾添加一个横幅广告。当我在Android模拟器上的开发版本上运行应用程序时,应用程序的其余部分在没有应用程序的情况下运
我已经编辑了 eth0,但我犯了一个错误,我的 VPS 现在处于脱机状态,甚至无法连接到 ssh,并在故障恢复控制台显示以下消息: “网络不可达”。 配置/编辑网络的命令是什么!? Photo 最佳答
今天早上我启动了我的 GCE 实例,并且 4/6 完全无法访问。所有这些都在同一个 us-east1-d 区域中。 SSH 连接也无法正常工作,因此我使用串行控制台连接到有问题的实例之一。 当我尝试
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 5年前关闭。 Improve this qu
我正在使用 Network.Browser 4000.0.9 检索网页: import Network.Browser import Network.HTTP main = do (uri
我正在尝试更新我在 docker 容器中的 apt 存储库,但我做不到。 docker run -it --dns 8.8.8.8 --dns 8.8.4.4 debian apt-get 更新 ..
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
Axios 是否可以区分以下内容: 由于客户端没有网络连接而失败的请求发出请求的时间 - (ERR_CONNECTION_REFUSED)。 由于网络连接丢失而失败的请求之后已发出请求,但在收到响应之
Unity 已升级其网络系统,并将旧网络称为遗留网络。 那么我们如何将 RPC 调用更改为新的 Unity Networking?这种方法的等价物是什么?我们应该为它编写自己的方法吗? (发送字节数组
在机器学习工具 vowpal wabbit ( https://github.com/JohnLangford/vowpal_wabbit/ ) 中,通常训练线性估计器 y*=wx。但是,可以添加前向
我正在尝试将 Boost 用于某些 IPv6 和多播网络通信。我需要构建一个使用特定网络接口(interface)索引的 IPv6 多播套接字。 我能够在 boost/asio/ip/detail/s
我是一名优秀的程序员,十分优秀!