neural-network - TensorFlow 训练-6ren

neural-network - TensorFlow 训练

转载作者：行者123 更新时间：2023-12-03 10:14:40

27

4

假设我有一个非常简单的神经网络，比如多层感知器。对于每一层，激活函数都是 sigmoid 并且网络是全连接的。

在 TensorFlow 中，这可能是这样定义的:

    sess = tf.InteractiveSession()

    # Training Tensor
    x = tf.placeholder(tf.float32, shape = [None, n_fft])
    # Label Tensor
    y_ = tf.placeholder(tf.float32, shape = [None, n_fft])

    # Declaring variable buffer for weights W and bias b
    # Layer structure [n_fft, n_fft, n_fft, n_fft]
    # Input -> Layer 1
    struct_w = [n_fft, n_fft]
    struct_b = [n_fft]
    W1 = weight_variable(struct_w, 'W1')
    b1 = bias_variable(struct_b, 'b1')
    h1 = tf.nn.sigmoid(tf.matmul(x, W1) + b1)

    # Layer1 -> Layer 2
    W2 = weight_variable(struct_w, 'W2')
    b2 = bias_variable(struct_b, 'b2')
    h2 = tf.nn.sigmoid(tf.matmul(h1, W2) + b2)

    # Layer2 -> output
    W3 = weight_variable(struct_w, 'W3')
    b3 = bias_variable(struct_b, 'b3')
    y = tf.nn.sigmoid(tf.matmul(h2, W3) + b3)

    # Calculating difference between label and output using mean square error
    mse = tf.reduce_mean(tf.square(y - y_))

    # Train the Model
    # Gradient Descent
    train_step = tf.train.GradientDescentOptimizer(0.3).minimize(mse)

此模型的设计目标是映射一个 n_fft将 fft 频谱图指向另一个 n_fft目标频谱图。让我们假设训练数据和目标数据的大小都是 [3000, n_fft] .它们存储在变量 spec_train 中和 spec_target .

现在问题来了。对于 TensorFlow，这两种训练有什么区别吗？

培训一:

for i in xrange(200):
        train_step.run(feed_dict = {x: spec_train, y_: spec_target})

培训2:

for i in xrange(200):
        for j in xrange(3000):
            train = spec_train[j, :].reshape(1, n_fft)
            label = spec_target[j, :].reshape(1, n_fft)
            train_step.run(feed_dict = {x: train, y_: label})

非常感谢!

最佳答案

在第一个训练版本中，您一次训练整批训练数据，这意味着 spec_train 的第一个和第 3000 个元素将在一个步骤中使用相同的模型参数进行处理。这被称为 (批量)梯度下降 .

在第二个训练版本中，您一次从训练数据中训练一个示例，这意味着 spec_train 的第 3000 个元素将使用自最近处理第一个元素以来已更新 2999 次的模型参数进行处理。这被称为 随机梯度下降 (或者如果元素是随机选择的)。

通常，TensorFlow 用于过大而无法一次性处理的数据集，因此小批量 SGD(在一个步骤中处理示例的子集)受到青睐。一次处理单个元素在理论上是可取的，但本质上是顺序的，并且具有很高的固定成本，因为矩阵乘法和其他操作在计算上并不那么密集。因此，一次处理小批量(例如 32 或 128 个)示例是常用的方法，在不同批次上并行训练多个副本。

看到这个 Stats StackExchange question有关何时应该使用一种方法与另一种方法的更多理论讨论。

关于neural-network - TensorFlow 训练，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34097457/

27

4

0

文章推荐： azure-devops - 通过REST API获取工作项的父项

文章推荐： javascript - ng-show 不只在加载时运行动画

文章推荐： javascript - 如何在jade中访问js数组的数据

文章推荐： selenium - 哪个 Firefox 版本与 Selenium 2.53.0 兼容？

networking - 在Elasticsearch集群中 “IN THE SAME NETWORK”是什么意思？
我正在使用AWS中的VM设置Elasticsearch集群。我知道每个节点都会自动尝试加入一个在同一网络中具有相同群集名称的现有群集。但是，我无法理解“同一网络” 是什么。为了了解同一网络，我发
javascript - Web3/元掩码 : Error: Contract has not been deployed to detected network (network/artifact mismatch) on Kovan network
我尝试部署一个已经存在于 Kovan 网络上的合约实例，以通过 web3 和 metamask 与其交互。首先，我将 metamask 设置为我的当前提供者，然后我部署了一个合约实例，如下所示:
docker - 创建默认 "bridge"网络 : cannot create network (docker0): conflicts with network (docker0): networks have same bridge name 时出错
停止 docker 后，它拒绝重新启动。它提示另一个名为 docker0 的网桥已经存在: level=warning msg="devmapper: Base device already exis
networking - 获取与 docker Network 关联的网桥名称
我正在使用“docker network create --d bridge mynet”创建一个 docker 网络。我想获取与此 docker 网络关联的网桥名称。我知道我可以使用“-o”来提供
networking - 如何使用Powershell配置Juniper Networks SA VPN连接设置
我的一位同事的VPN连接有问题。似乎他的操作系统重设了代理设置，并且他需要手动将其更改回。有没有办法使用Powershell设置VPN和代理？他正在使用Windows 7，因此可以使用Powersh
azure - 如何从Azure指标获取 "Network In"和 "Network Out"？
我在 Azure VM 中有一个虚拟机，我想获取网络输入/网络输出指标。在 Azure 门户中，我将诊断设置和指标设置为存储到选定的存储表中。但存储的指标与我在 Azure 门户中看到的指标之间存在
networking - docker network 连接到主机的第二个接口(interface)
我有一个用例，我的 Docker 容器的第二个接口(interface)需要共享主机的第二个网络接口(interface)的接口(interface)。这可能使用 docker network con
azure - 如何从Azure指标获取 "Network In"和 "Network Out"？
我在 Azure VM 中有一个虚拟机，我想获取网络输入/网络输出指标。在 Azure 门户中，我将诊断设置和指标设置为存储到选定的存储表中。但存储的指标与我在 Azure 门户中看到的指标之间存在
networking - docker : How to find the network my container is in?
我想了解一些关于 Docker 的事情: 如何找到我的容器所在的网络？我可以动态分离我的容器并附加到其他网络吗？怎么样？如果我有两个容器正在运行，如何检查这两个容器是否在同一个网络？我可以 pin
Error: googleMobileAds/error-code-network-error The ad request was unsuccessful due to network connectivity(错误：googleMobileAds/Error-Code-Network-Error由于网络连接，广告请求未成功)
我已经开发了一款使用Reaction Native和世博会的应用程序，并想在它的末尾添加一个横幅广告。当我在Android模拟器上的开发版本上运行应用程序时，应用程序的其余部分在没有应用程序的情况下运
networking - 连接 "Network is Unreachable"VPS Centos
我已经编辑了 eth0，但我犯了一个错误，我的 VPS 现在处于脱机状态，甚至无法连接到 ssh，并在故障恢复控制台显示以下消息: “网络不可达”。配置/编辑网络的命令是什么!？ Photo 最佳答
networking - GCE 实例无法访问 - 连接 : Network is unreachable
今天早上我启动了我的 GCE 实例，并且 4/6 完全无法访问。所有这些都在同一个 us-east1-d 区域中。 SSH 连接也无法正常工作，因此我使用串行控制台连接到有问题的实例之一。当我尝试
networking - VirtualBox 虚拟机中的 “connect: Network is unreachable”
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 5年前关闭。 Improve this qu
networking - 如何将 Network.Browser.browse 的日志静音到标准输出？
我正在使用 Network.Browser 4000.0.9 检索网页: import Network.Browser import Network.HTTP main = do (uri
networking - docker 连接(101 : Network is unreachable)
我正在尝试更新我在 docker 容器中的 apt 存储库，但我做不到。 docker run -it --dns 8.8.8.8 --dns 8.8.4.4 debian apt-get 更新 ..
networking - 超 V : Network Adapter Drivers
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎不是关于 a specific programming problem, a softwar
javascript - axios能否区分 "no network"和 "network disconnected"
Axios 是否可以区分以下内容: 由于客户端没有网络连接而失败的请求发出请求的时间 - (ERR_CONNECTION_REFUSED)。由于网络连接丢失而失败的请求之后已发出请求，但在收到响应之
networking - 在新的 Unity Networking 中，RPC 相当于什么？
Unity 已升级其网络系统，并将旧网络称为遗留网络。那么我们如何将 RPC 调用更改为新的 Unity Networking？这种方法的等价物是什么？我们应该为它编写自己的方法吗？ (发送字节数组
neural-network - Vowpal 兔 : Input of neural network?
在机器学习工具 vowpal wabbit ( https://github.com/JohnLangford/vowpal_wabbit/ ) 中，通常训练线性估计器 y*=wx。但是，可以添加前向
networking - 为 IPv6 找到正确的 "network interface"号码
我正在尝试将 Boost 用于某些 IPv6 和多播网络通信。我需要构建一个使用特定网络接口(interface)索引的 IPv6 多播套接字。我能够在 boost/asio/ip/detail/s

首页

博学

6Ren·AI

商城

neural-network - TensorFlow 训练