lstm - 将 LSTM 中的 Tanh 激活更改为 ReLU-6ren

lstm - 将 LSTM 中的 Tanh 激活更改为 ReLU

转载作者：行者123 更新时间：2023-12-04 18:01:21

25

4

LSTM 类中的默认非线性激活函数是 tanh。我希望在我的项目中使用 ReLU。浏览文档和其他资源，我无法找到一种简单的方法来做到这一点。我能找到的唯一方法是定义我自己的自定义 LSTMCell，但是 here作者说自定义 LSTMCells 不支持 GPU 加速功能(或者自文章发表后是否发生了变化？)。我需要使用 CUDA 来加速我的训练。任何帮助，将不胜感激。

最佳答案

自定义 LSTMCells 不支持 GPU 加速功能 - 此声明可能意味着如果您使用 LSTMCells，GPU 加速功能将受到限制。当然，您可以编写自己的 LSTM 实现，但需要牺牲运行时间。

例如，一旦我实现了如下的 LSTM(基于线性层)，它所花费的时间是 LSTM 的 2~3 倍(在 PyTorch 中提供)用作深度神经模型的一部分时。

class LSTMCell(nn.Module):
    def __init__(self, input_size, hidden_size, nlayers, dropout):
        """"Constructor of the class"""
        super(LSTMCell, self).__init__()

        self.nlayers = nlayers
        self.dropout = nn.Dropout(p=dropout)

        ih, hh = [], []
        for i in range(nlayers):
            ih.append(nn.Linear(input_size, 4 * hidden_size))
            hh.append(nn.Linear(hidden_size, 4 * hidden_size))
        self.w_ih = nn.ModuleList(ih)
        self.w_hh = nn.ModuleList(hh)

    def forward(self, input, hidden):
        """"Defines the forward computation of the LSTMCell"""
        hy, cy = [], []
        for i in range(self.nlayers):
            hx, cx = hidden[0][i], hidden[1][i]
            gates = self.w_ih[i](input) + self.w_hh[i](hx)
            i_gate, f_gate, c_gate, o_gate = gates.chunk(4, 1)

            i_gate = F.sigmoid(i_gate)
            f_gate = F.sigmoid(f_gate)
            c_gate = F.tanh(c_gate)
            o_gate = F.sigmoid(o_gate)

            ncx = (f_gate * cx) + (i_gate * c_gate)
            nhx = o_gate * F.tanh(ncx)
            cy.append(ncx)
            hy.append(nhx)
            input = self.dropout(nhx)

        hy, cy = torch.stack(hy, 0), torch.stack(cy, 0)
        return hy, cy

我很高兴知道 LSTM 的自定义实现的运行时间是否可以改进!

关于lstm - 将 LSTM 中的 Tanh 激活更改为 ReLU，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49040180/

25

4

0

文章推荐： kotlin - Kotlin 中的通用对象

文章推荐： erlang - 如何验证 erlang 进程是否已休眠？

文章推荐： inno-setup - 从 Inno Setup [代码] 中拆卸字符串

详解dedecms后台编辑器将回车改为的方法
CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界. 这篇CFSDN的博客文章详解dedecms后台编辑器将回车改为的方法由作者收集整理，如果你对
javascript - 如何将改为
？
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 6 年前。 Improve th
javascript - 改为 JS 文件中的谷歌分析？
不是将代码放在正文的头部或末尾(我把它放在正文的末尾)，如果我将代码放在 JS 文件中而不是在 html 中它自己的脚本标记，是否可以？ (我假设它像任何其他代码一样工作正常，但我问以防万一) 最佳答
postgresql - PSQL 命令行结束从 => 改为 (>
我尝试执行从\e 命令编写的查询，但现在我无法执行任何查询，但可以在 PSQL 中执行命令。现在我注意到这一点，我输入的命令现在在\e 中。当我关闭\e(尝试运行它)时问题开始了。最佳答案 ps
Java字符串替换(去掉换行符，将$改为\$)
我有一个这样的字符串($ 字符总是被其他字符包围): a$b c$d e$f 我希望我的字符串方法在 $ 前面放置一个 \ 并删除换行符: a\$bc\$de\$f 我试过了，但它没有放入 \ 字符:
java - 如何防止Java将XML文件中的 "&"改为 "&"
我需要使用 Java 构建一个 XML 文件。问题是我必须使用一些特殊字符，例如“ć”，然后在我的移动应用程序中读取它。如果我手动更改 ć 就可以正常工作至 ć在我的 XML 文件中的记事
javascript - 将改为 useMutation
我有一个removeUser 页面，我在其中使用，然后使用submitForm() 函数进行错误处理。这段代码运行得非常好: export default function RemoveUserPag
mysql - SQL查询将前面两个数字从 "2048"改为 "1948"
我在数据库 “2048-05-21” 中有一个看起来像这样的日期我只想得到年份，在这一年我只想得到两个后面的数字并将两个前面的数字更改为19 example: data : 2048-05-21 1
JAVA- 将 111 改为 123
public class Venus1 { public static void main(String args[]) { int[]x={1,2,3};
javascript - 改为 JavaScript 的 array_count_values
我有以下 PHP 脚本，现在我需要在 JavaScript 中做同样的事情。 JavaScript 中是否有类似于 PHP 函数的函数，我已经搜索了好几天但找不到类似的东西？我想做的是计算某个单词在数
c++ - #define 改为 constexpr auto
这个问题在这里已经有了答案: Is it bad practice to specify an array size using a variable instead of `#define` in
android - 如何将列表中的所有复选框 'check' 改为 'check' 单个复选框？
我陷入了一种情况，我必须通过“选中”工具栏中的复选框来“选中”列表中存在的所有复选框。这是创建复选框列表的代码:- itemTpl: 'checked="checked" /> {groupName
python - Python 改为 UTF-8 后出现奇怪的字符
我正在使用Python3。在分析一些网站时，我遇到了一些奇怪的字符并寻找解决方案。我找到了一个，但在找到解决方案之前，我尝试了一些方法，并且知道我无法重置它。当我使用 Jupyter 笔记本将列表 l
unity-game-engine - UnityWebRequest 改为 https
我在 http 下有 unity android app 和 site api 的工作基础设施。最近换了服务器，申请了ssl证书。现在我的 api 在 https 下。在 unity 应用程序中，
unity-game-engine - UnityWebRequest 改为 https
我在 http 下有 unity android app 和 site api 的工作基础设施。最近换了服务器，申请了ssl证书。现在我的 api 在 https 下。在 unity 应用程序中，
ios - objective-C 。 NSString 改为 NSCFNumber
我在 Objective-C 中有一些代码。我想，我收到了 NSString 类型，但是当我尝试将它保存在核心数据中时，我得到了一个 user.clientID = clientID; 错误，例如:
php - 将 Varchar 改为 Time 类型
在表中我有一个名为 CallTime 的字段 (Varchar)。包括晚上8:00、晚上8:40、上午10:00等时间我想将字段类型更改为“时间”并更新时间格式。该怎么做？谢谢最佳答案 UPD
c# - 为什么将 int 改为 long 会加快执行速度？
这个问题在这里已经有了答案: C# - for Loop Freezes at strange intervals (3 个答案) 关闭 6 年前。我试图解决 problem #14 from P
list - 预期为 'collections.Iterable' ，改为 Optional[list]
我今天在 Pycharm 社区版 5.0.3 中收到了这个错误，想知道这是否只是我做错了/没有意识到，或者是 PyCharm lint 问题。重现错误的代码是 mylist = list() # fi
java - 如何在页面上显示实体？改为 [Entity of type ... with id : 1]
我的目标是将数据库中的随机文本显示到网页上。首先，我不知道为什么我的数据没有保存，为什么我得到的是[Entity of type sec.helloweb.HelloMessage with id:

首页

博学

6Ren·AI

商城

lstm - 将 LSTM 中的 Tanh 激活更改为 ReLU