gpt4 book ai didi

python - 模型训练时间较长

转载 作者:行者123 更新时间:2023-11-30 08:58:03 27 4
gpt4 key购买 nike

我使用 PyTorch 在 VGG-16 模型中进行卷积后添加了一个 LSTM 层。随着时间的推移,模​​型学习得很好。然而,仅添加一层由 32 个 LSTM 单元组成的 LSTM 层后,训练和评估过程的时间就会延长约 10 倍。

我将 LSTM 层添加到 VGG 框架中,如下所示

def make_layers(cfg, batch_norm=False):
# print("Making layers!")
layers = []
in_channels = 3
count=0
for v in cfg:
count+=1
if v == 'M':
layers += [nn.MaxPool2d(kernel_size=2, stride=2)]
else:
conv2d = nn.Conv2d(in_channels, v, kernel_size=3, padding=1)
if batch_norm:
layers += [conv2d, nn.BatchNorm2d(v), nn.ReLU(inplace=True)]
else:
layers += [conv2d, nn.ReLU(inplace=True)]
in_channels=v
if count==5:
rlstm =RLSTM(v)
rlstm=rlstm.cuda()
layers+=[rlstm]

RLSTM 是我的自定义类,它实现了来自 Google Pixel RNN 论文的 RowLSTM。

这是一个常见问题吗?一般来说,LSTM 层训练需要很长时间吗?

最佳答案

是的,由于 LSTM(以及许多其他 RNN)依赖于顺序输入信息,因此您会失去 CNN 通常具有的大部分并行化速度。您可以探索其他类型的 RNN,它们利用更多可并行化的算法,但与 LSTM/GRU 相比,它们的预测性能的结论尚未确定

关于python - 模型训练时间较长,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51637854/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com