neural-network - 使用 Flux.jl 理解损失函数行为的问题。在 Julia-6ren

neural-network - 使用 Flux.jl 理解损失函数行为的问题。在 Julia

转载作者：行者123 更新时间：2023-12-04 09:14:49

29

4

所以。首先，我是神经网络(NN)的新手。
作为博士学位的一部分，我正在尝试通过神经网络解决一些问题。
为此，我创建了一个程序来创建一些数据集
输入向量的集合(每个向量有 63 个元素)及其对应的
输出向量(每个向量有 6 个元素)。
所以，我的程序是这样的:

Nₜᵣ            = 25;   # number of inputs in the data set
xtrain, ytrain = dataset_generator(Nₜᵣ); # generates In/Out vectors: xtrain/ytrain
datatrain      = zip(xtrain,ytrain);     # ensamble my data

现在，两个 xtrain和 ytrain属于 Array{Array{Float64,1},1} 类型，意思是
如果(说) Nₜᵣ = 2 ，他们看着像是:

julia> xtrain    #same for ytrain
2-element Array{Array{Float64,1},1}:
 [1.0, -0.062, -0.015, -1.0, 0.076, 0.19, -0.74, 0.057, 0.275, ....]
 [0.39, -1.0, 0.12, -0.048, 0.476, 0.05, -0.086, 0.85, 0.292, ....]

每个向量的前3个元素被归一化为unity(代表x,y,z坐标)，后面的60个数字也被归一化为unity，对应一些可测量的属性。
该计划继续如下:

layer1 = Dense(length(xtrain[1]),46,tanh); # setting 6 layers
layer2 = Dense(46,36,tanh)            ;
layer3 = Dense(36,26,tanh)            ;
layer4 = Dense(26,16,tanh)            ;
layer5 = Dense(16,6,tanh)             ;
layer6 = Dense(6,length(ytrain[1]))   ;

m = Chain(layer1,layer2,layer3,layer4,layer5,layer6); # composing the layers

squaredCost(ym,y) = (1/2)*norm(y - ym).^2; 
loss(x,y)         = squaredCost(m(x),y); # define loss function

ps  = Flux.params(m);         # initializing mod.param. 
opt = ADAM(0.01, (0.9, 0.8)); #

最后:

trainmode!(m,true)
itermax = 700;    # set max number of iterations
losses = [];     
for iter in 1:itermax
    Flux.train!(loss,ps,datatrain,opt);
    push!(losses, sum(loss.(xtrain,ytrain)));
end

它运行得很好，但是，我注意到当我用增加的数据集( Nₜᵣ = 10,15,25 等)训练我的模型时，损失函数接缝增加。见下图:

其中:y1:Nₜᵣ=10，y2:Nₜᵣ=15，y3:Nₜᵣ=25。
所以，我的主要问题是:

为什么会这样？ .我看不到这种行为的解释。这是以某种方式预期的吗？

备注:注意

训练数据集中的所有元素(输入和输出)都归一化为 [-1,1]。

我还没有尝试改变事件。功能

我还没有尝试改变优化方法

注意事项:我需要一个包含近 10000 个输入向量的训练数据集，所以我期待更糟糕的情况......

一些个人想法:

我是否正确安排了我的训练数据集？比如说，如果每个数据向量都由 63 个数字组成，那么将它们分组在一个数组中是否正确？然后将它们堆成一个´´´Array{Array{Float64,1},1}´´´?。我没有使用 NN 和 的经验助焊剂 .如何以不同的方式制作 10000 个 I/O 向量的数据集？这可能是问题吗？。 (我很倾向于这个)

这种行为是否与所选择的行为有关。职能？ (我不倾向于这个)

这种行为是否与 opt.算法？ (我不倾向于这个)

我训练我的模型错了吗？迭代循环是真正的迭代还是时代。我正在努力将(区分)这个“时代”和“迭代”的概念付诸实践。

最佳答案

loss(x,y)         = squaredCost(m(x),y); # define loss function

您的损失未标准化，因此添加更多数据只会增加此成本函数。然而，每条数据的成本似乎并没有增加。为了摆脱这种影响，您可能希望通过使用均方成本之类的方法来使用归一化成本函数。

关于neural-network - 使用 Flux.jl 理解损失函数行为的问题。在 Julia ，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63273996/

29

4

0

文章推荐： python - 具有嵌套 for 循环、条件和累加器的列表理解

文章推荐： python - 在 Python 中使用最大似然推导回归系数

文章推荐： verilog - 如何在时钟的 posedge 和 negedge 设置信号？

networking - 在Elasticsearch集群中 “IN THE SAME NETWORK”是什么意思？
我正在使用AWS中的VM设置Elasticsearch集群。我知道每个节点都会自动尝试加入一个在同一网络中具有相同群集名称的现有群集。但是，我无法理解“同一网络” 是什么。为了了解同一网络，我发
javascript - Web3/元掩码 : Error: Contract has not been deployed to detected network (network/artifact mismatch) on Kovan network
我尝试部署一个已经存在于 Kovan 网络上的合约实例，以通过 web3 和 metamask 与其交互。首先，我将 metamask 设置为我的当前提供者，然后我部署了一个合约实例，如下所示:
docker - 创建默认 "bridge"网络 : cannot create network (docker0): conflicts with network (docker0): networks have same bridge name 时出错
停止 docker 后，它拒绝重新启动。它提示另一个名为 docker0 的网桥已经存在: level=warning msg="devmapper: Base device already exis
networking - 获取与 docker Network 关联的网桥名称
我正在使用“docker network create --d bridge mynet”创建一个 docker 网络。我想获取与此 docker 网络关联的网桥名称。我知道我可以使用“-o”来提供
networking - 如何使用Powershell配置Juniper Networks SA VPN连接设置
我的一位同事的VPN连接有问题。似乎他的操作系统重设了代理设置，并且他需要手动将其更改回。有没有办法使用Powershell设置VPN和代理？他正在使用Windows 7，因此可以使用Powersh
azure - 如何从Azure指标获取 "Network In"和 "Network Out"？
我在 Azure VM 中有一个虚拟机，我想获取网络输入/网络输出指标。在 Azure 门户中，我将诊断设置和指标设置为存储到选定的存储表中。但存储的指标与我在 Azure 门户中看到的指标之间存在
networking - docker network 连接到主机的第二个接口(interface)
我有一个用例，我的 Docker 容器的第二个接口(interface)需要共享主机的第二个网络接口(interface)的接口(interface)。这可能使用 docker network con
azure - 如何从Azure指标获取 "Network In"和 "Network Out"？
我在 Azure VM 中有一个虚拟机，我想获取网络输入/网络输出指标。在 Azure 门户中，我将诊断设置和指标设置为存储到选定的存储表中。但存储的指标与我在 Azure 门户中看到的指标之间存在
networking - docker : How to find the network my container is in?
我想了解一些关于 Docker 的事情: 如何找到我的容器所在的网络？我可以动态分离我的容器并附加到其他网络吗？怎么样？如果我有两个容器正在运行，如何检查这两个容器是否在同一个网络？我可以 pin
Error: googleMobileAds/error-code-network-error The ad request was unsuccessful due to network connectivity(错误：googleMobileAds/Error-Code-Network-Error由于网络连接，广告请求未成功)
我已经开发了一款使用Reaction Native和世博会的应用程序，并想在它的末尾添加一个横幅广告。当我在Android模拟器上的开发版本上运行应用程序时，应用程序的其余部分在没有应用程序的情况下运
networking - 连接 "Network is Unreachable"VPS Centos
我已经编辑了 eth0，但我犯了一个错误，我的 VPS 现在处于脱机状态，甚至无法连接到 ssh，并在故障恢复控制台显示以下消息: “网络不可达”。配置/编辑网络的命令是什么!？ Photo 最佳答
networking - GCE 实例无法访问 - 连接 : Network is unreachable
今天早上我启动了我的 GCE 实例，并且 4/6 完全无法访问。所有这些都在同一个 us-east1-d 区域中。 SSH 连接也无法正常工作，因此我使用串行控制台连接到有问题的实例之一。当我尝试
networking - VirtualBox 虚拟机中的 “connect: Network is unreachable”
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 5年前关闭。 Improve this qu
networking - 如何将 Network.Browser.browse 的日志静音到标准输出？
我正在使用 Network.Browser 4000.0.9 检索网页: import Network.Browser import Network.HTTP main = do (uri
networking - docker 连接(101 : Network is unreachable)
我正在尝试更新我在 docker 容器中的 apt 存储库，但我做不到。 docker run -it --dns 8.8.8.8 --dns 8.8.4.4 debian apt-get 更新 ..
networking - 超 V : Network Adapter Drivers
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎不是关于 a specific programming problem, a softwar
javascript - axios能否区分 "no network"和 "network disconnected"
Axios 是否可以区分以下内容: 由于客户端没有网络连接而失败的请求发出请求的时间 - (ERR_CONNECTION_REFUSED)。由于网络连接丢失而失败的请求之后已发出请求，但在收到响应之
networking - 在新的 Unity Networking 中，RPC 相当于什么？
Unity 已升级其网络系统，并将旧网络称为遗留网络。那么我们如何将 RPC 调用更改为新的 Unity Networking？这种方法的等价物是什么？我们应该为它编写自己的方法吗？ (发送字节数组
neural-network - Vowpal 兔 : Input of neural network?
在机器学习工具 vowpal wabbit ( https://github.com/JohnLangford/vowpal_wabbit/ ) 中，通常训练线性估计器 y*=wx。但是，可以添加前向
networking - 为 IPv6 找到正确的 "network interface"号码
我正在尝试将 Boost 用于某些 IPv6 和多播网络通信。我需要构建一个使用特定网络接口(interface)索引的 IPv6 多播套接字。我能够在 boost/asio/ip/detail/s

首页

博学

6Ren·AI

商城

neural-network - 使用 Flux.jl 理解损失函数行为的问题。在 Julia