gpt4 book ai didi

python - Seq2Seq 模型适合我的数据吗?

转载 作者:行者123 更新时间:2023-11-30 08:53:35 25 4
gpt4 key购买 nike

我正在尝试训练一个模型来预测网页的设计模式。我正在使用给定一堆元素分组的边界矩形的坐标。模式如下所示:

 [[elementId, width, height, x, y]]

所以我的目标将是给定[[elementId, width, height]][[x,y]]

具体:

 [[5, 1.0, 1.0], [4, 1.0, 1.0], [2, 175.0, 65.0], [2, 1.0, 1.0], [4, 1.0, 1.0]]
->
[[0.0, 0.0], [0.0, 10.0], [3.0, 0.0], [0.0, 68.0], [0.0, 10.0]]


[[2, 14.0, 14.0], [2, 14.0, 14.0], [2, 14.0, 14.0]]
->
[[0.0, 3.0], [0.0, 3.0], [0.0, 3.0]]

图案的大小各不相同,因此我用 [[0,0,0]] 填充它们。我目前拥有大约 15k,但可以获取更多。

我被告知带有注意力的 seq2seq 是这项工作的正确模型。我从 https://machinelearningmastery.com/develop-encoder-decoder-model-sequence-sequence-prediction-keras/ 开始并取得了可怕的结果。

我能找到的每个 seq2seq 示例(搜索 keras 或 pytorch)都用于分类翻译,我正在努力寻找一个基于回归的良好示例。

所以我的问题是:

1)对于我想要做的事情来说,这是正确的模型(编码器/解码器 LSTM)吗?

2)如果有的话有什么例子吗?

提前非常感谢。我不期望任何人解决我的问题,但任何帮助将不胜感激!

最佳答案

当输入/输出长度可变时使用 Seq2Seq/LSTM。

您的输入大小为 3,输出大小为 2(至少对于给定的示例而言)。因此,您可以使用带有 L2/L1 损失(用于回归)的简单一/二隐藏层前馈模型。任何选择(SGD/Adam)都应该没问题,但是,Adam 在实践中效果很好。

另外,我认为你不应该按原样使用坐标,你可以缩放它,使最高坐标为 1,因此输入/输出范围将在 0 和 1 之间。另一个优点是,这将帮助你直观地推广到不同的屏幕尺寸。

关于python - Seq2Seq 模型适合我的数据吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51412473/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com