machine-learning - 在 Flux-Julia 中使用 LSTM 建模全序列-6ren

machine-learning - 在 Flux-Julia 中使用 LSTM 建模全序列

转载作者：行者123 更新时间：2023-11-30 09:14:08

25

4

我正在尝试训练 LSTM 以基于 x 序列(不仅仅是最后一项或分类器)对完整序列 y 进行建模。使用以下代码，尽管损失函数起作用，但训练不起作用。看来点形式主义不适用于火车! ？我有什么想法可以做到吗？在 Keras 中，事情就这么简单......提前致谢，马库斯

using Flux

# Create synthetic data first
### Function to generate x consisting of three variables and a sequence length of 200
    function generateX()
        x1 = Array{Float32, 1}(randn(200))
        x2 = Array{Float32, 1}(randn(200))
        x3 = Array{Float32, 1}(sin.((0:199) / 12*2*pi))
        xdata=[x1 x2 x3]'
        return(xdata)
    end

### Generate 50 of these sequences of x
    xdata = [generateX() for i in 1:50]

### Function to generate sequence of y from x sequence
    function yfromx(x)
        y=Array{Float32, 1}(0.2*cumsum(x[1,:].*x[2,:].*exp.(x[1,:])) .+x[3,:])
        return(y')
    end
    ydata =  map(yfromx, xdata);
    
### Now rearrange such that there is a sequence of 200 X inputs, i.e. an array of x vectors (and 50 of those sequences)
    xdata=Flux.batch(xdata) 
    xdata2 = [xdata[:,s,c] for s in 1:200, c in 1:50]
    xdata= [xdata2[:,c] for c in 1:50]
 
### Same for y
    ydata=Flux.batch(ydata)
    ydata2 = [ydata[:,s,c] for s in 1:200, c in 1:50]
    ydata= [ydata2[:,c] for c in 1:50]
    
### Define model and loss function. "model." returns sequence of y from sequence of x
    import Base.Iterators: flatten
    model=Chain(LSTM(3, 26), Dense(26,1))
    
    loss(x,y) = Flux.mse(collect(flatten(model.(x))),collect(flatten(y)))
    
    model.(xdata[1]) # works fine
    loss(xdata[2],ydata[2]) # also works fine

    Flux.train!(loss, params(model), zip(xdata, ydata), ADAM(0.005)) ## Does not work, see error below. How to work around?

错误消息

Mutating arrays is not supported

Stacktrace:
 [1] error(::String) at ./error.jl:33
 [2] (::getfield(Zygote, Symbol("##992#993")))(::Nothing) at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Zygote/fw4Oc/src/lib/array.jl:44
 [3] (::getfield(Zygote, Symbol("##2633#back#994")){getfield(Zygote, Symbol("##992#993"))})(::Nothing) at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/ZygoteRules/6nssF/src/adjoint.jl:49
 [4] copyto! at ./abstractarray.jl:725 [inlined]
 [5] (::typeof(∂(copyto!)))(::Array{Float32,1}) at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Zygote/fw4Oc/src/compiler/interface2.jl:0
 [6] _collect at ./array.jl:550 [inlined]
 [7] (::typeof(∂(_collect)))(::Array{Float32,1}) at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Zygote/fw4Oc/src/compiler/interface2.jl:0
 [8] collect at ./array.jl:544 [inlined]
 [9] (::typeof(∂(collect)))(::Array{Float32,1}) at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Zygote/fw4Oc/src/compiler/interface2.jl:0
 [10] loss at ./In[20]:4 [inlined]
 [11] (::typeof(∂(loss)))(::Float32) at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Zygote/fw4Oc/src/compiler/interface2.jl:0
 [12] #153 at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Zygote/fw4Oc/src/lib/lib.jl:142 [inlined]
 [13] #283#back at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/ZygoteRules/6nssF/src/adjoint.jl:49 [inlined]
 [14] #15 at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Flux/oX9Pi/src/optimise/train.jl:69 [inlined]
 [15] (::typeof(∂(λ)))(::Float32) at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Zygote/fw4Oc/src/compiler/interface2.jl:0
 [16] (::getfield(Zygote, Symbol("##38#39")){Zygote.Params,Zygote.Context,typeof(∂(λ))})(::Float32) at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Zygote/fw4Oc/src/compiler/interface.jl:101
 [17] gradient(::Function, ::Zygote.Params) at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Zygote/fw4Oc/src/compiler/interface.jl:47
 [18] macro expansion at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Flux/oX9Pi/src/optimise/train.jl:68 [inlined]
 [19] macro expansion at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Juno/oLB1d/src/progress.jl:134 [inlined]
 [20] #train!#12(::getfield(Flux.Optimise, Symbol("##16#22")), ::typeof(Flux.Optimise.train!), ::Function, ::Zygote.Params, ::Base.Iterators.Zip{Tuple{Array{Array{Array{Float32,1},1},1},Array{LinearAlgebra.Adjoint{Float32,Array{Float32,1}},1}}}, ::ADAM) at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Flux/oX9Pi/src/optimise/train.jl:66
 [21] train!(::Function, ::Zygote.Params, ::Base.Iterators.Zip{Tuple{Array{Array{Array{Float32,1},1},1},Array{LinearAlgebra.Adjoint{Float32,Array{Float32,1}},1}}}, ::ADAM) at /Net/Groups/BGI/scratch/mreichstein/julia_atacama_depots/packages/Flux/oX9Pi/src/optimise/train.jl:64
 [22] top-level scope at In[24]:1

loss(xdata[2],ydata[2])

最佳答案

好吧，按照Frederik的路径，以下损失似乎有效，但坦率地说我不太喜欢它，所以我仍然想知道是否有更优雅/惯用/高效(？)的解决方案...

function loss(x,y) 
    yhat=model.(x)
    s=0
    for i in 1:length(yhat)
        s+=(yhat[i][1] - y[i][1])^2
    end

    s/=length(yhat)
    s    

end

关于machine-learning - 在 Flux-Julia 中使用 LSTM 建模全序列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59489967/

25

4

0

文章推荐： python-3.x - ONNX 图 Python

文章推荐： machine-learning - 使用多项式核相当于添加特征吗？

文章推荐： java - NoClassDefFoundError : com. sforce.soap.enterprise.Connector

java - 如何构建避免嵌套 Flux block (Flux>)的响应式架构？
我正在尝试构建一个应用程序 A(如适配器)，它将: 1)接收带有某些 key (JSON格式)的POST请求 2) 它应该以某种方式修改该 key 并向另一个系统 B 创建 POST 请求。 3)应用
reactjs-flux - Flux Dispatcher - 查看操作与服务器操作
除了语义之外，是否有任何理由为 View 和服务器操作创建不同的调度方法？我见过的所有教程和示例(最值得注意的是 this )在监听已分派(dispatch)的有效负载时完全忽略源常量，以支持打开有效
flux - Flux Dispatch.dispatch(…):无法在调度过程中调度
我的密码 https://gist.github.com/ButuzGOL/707d1605f63eef55e4af 因此，当我收到登录成功回调时，我想进行重定向，重定向也可以通过调度程序进行。我
reactjs-flux - 如何在 Flux 中处理具有依赖关系的数据组合和检索？
我试图找出使用 Flux 架构处理中型复杂应用程序中相当常见的情况的最佳方法是什么，当组成数据的模型之间存在依赖关系时如何从服务器检索数据。例如: 商店网络应用程序，具有以下模型: 购物车(用户可以拥
java - Flux 完成时获取 Flux 大小
我有点坚持一项琐碎的任务:每当我使用响应式 spring WebClient 查询外部 API 或查询响应式 MongoDBRepository 时，我想记录有多少实体通过了我的通量，例如。记录消息，
java - 使用来自 flux 的数据将 flux 减少为单声道
我有这种情况。我有一个分页 API，它为我提供了过去 12 个月的数据。 API 的响应如下: public class PagedTransfersDto { private List cont
java - 如何从另一个 Flux 中排除 Flux 中的所有元素
我有两个 Flux，一个用于成功元素，另一个用于保存错误元素 Flux success= Flux.just("Orange", "Apple", "Banana","Grape", "Strawbe
java - 从两个 Flux 生成 Flux
我现在正在使用 Flux .我想创建一个 Flux来自两个不同的对象 Flux .我知道我必须使用 BiFunction但我不知道怎么办。第一个对象对第一个对象有 PK，第二个 FK。我想压缩 PK=
reactjs-flux - 在 Flux 应用程序中跟踪 ajax 请求状态
我们正在重构一个大型 Backbone 应用程序以使用 Flux 来帮助解决一些紧密耦合和事件/数据流问题。但是，我们还没有弄清楚如何处理需要知道特定 ajax 请求状态的情况当 Controlle
java - Flux.concatMapIterable 和 Flux.flatMapIterable 有什么区别？
作为主题，Flux.concatMapIterable 和 Flux.flatMapIterable 都不会根据大理石图交错，这与 Flux.concatMap 和 Flux.flatMap 其中 f
java - Flux.take(x) 或 Flux.all(..) 不会等待所有排放
我有一个flux这是由 Iterable 构建的8 个元素 ( Flux.fromIterable(..) )。对于每个通量排放，我想异步调用一个方法。我尝试了各种方法 dispatchOn和publ
java - 如何迭代 Flux 并使用来自另一个 Mono 的结果来过滤 Flux
Mono mono1 = repository.get(id); // data from reactive mongo Flux availabilityInfo = getAvailability
javascript - React + Flux 和服务端渲染？ (同构 React + Flux)
使用同构应用程序设置应用程序初始状态的一般做法是什么？如果没有 Flux，我会简单地使用类似的东西: var props = { }; // initial state var html = Reac
java - 如何将 Flux> 扁平化为 Flux？
你好，我的代码是这样的: fun mapBatch(batch: List): Mono> ... fun myFun(stream: Flux): Flux { return stream
java - 项目 Reactor 中的 Parallel Flux 与 Flux
所以我从文档中了解到，并行 Flux 本质上是将通量元素划分为单独的轨道。(本质上类似于分组)。就线程而言，这将是调度程序的工作。因此，让我们考虑这样的情况。所有这些都将在通过 runOn() 方法提
project-reactor - Flux.map 与 Flux.flatMap 的一对一操作
我一直看到使用 flatMap 的例子对于 1 对 1 操作，例如: Flux.just("a", "b", "c") .flatMap(s -> Mono.just(s.toUpperCas
project-reactor - Flux.create 和 Flux.generate 的区别
Flux.create 和有什么区别和 Flux.generate ?我正在寻找 - 最好是使用示例用例 - 了解我何时应该使用其中一个。最佳答案简而言之: Flux::create doesn'
java - 仅当源更新时才从 Flux 发布到 Flux>
我想发布 key 列表，但仅限于修改 key 时。通过以下内容，即使没有任何更改，它也会以无限循环的方式发布值 RedisReactiveCommands commands = connec
reactjs-flux - Flux- 无限滚动 : i cannot think of how to stick to unidirectional data flow
我正在尝试从我从服务器获得的许多项目中实现无限滚动，但我找不到任何适当的方法来保持通量架构设计规则。想法是:在第一次加载时，我从服务器获取完整的项目列表(只有 id)，然后使用 ajax 每次获取
java - Spring react : convert Flux> to Flux
我有端点:/upstreams 它将返回以下格式的 Json: { "next" : "String", "data" : [ { "id" : "String",

首页

博学

6Ren·AI

商城

machine-learning - 在 Flux-Julia 中使用 LSTM 建模全序列

错误消息