torch - 如何使用 DataParallel 并行化 Pytorch 中的 RNN 函数-6ren

torch - 如何使用 DataParallel 并行化 Pytorch 中的 RNN 函数

转载作者：行者123 更新时间：2023-12-02 02:34:04

25

4

这是一个用于运行基于字符的语言生成的 RNN 模型:

class RNN(nn.Module):
    def __init__(self, input_size, hidden_size, output_size, n_layers):
        super(RNN, self).__init__()
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.output_size = output_size
        self.n_layers = n_layers 

        self.encoder = nn.Embedding(input_size, hidden_size)
        self.GRU = nn.GRU(hidden_size, hidden_size, n_layers, batch_first=True) 
        self.decoder = nn.Linear(hidden_size, output_size)


    def forward(self, input, batch_size):
        self.init_hidden(batch_size)
        input = self.encoder(input)
        output, self.hidden = self.GRU(input, self.hidden) 
        output = self.decoder(output.view(batch_size, self.hidden_size)) 
        return output

    def init_hidden(self, batch_size):
        self.hidden = Variable(torch.randn(self.n_layers, batch_size, self.hidden_size).cuda())

我使用 DataParallel 实例化模型，以将批量输入拆分到 4 个 GPU 上:

net = torch.nn.DataParallel(RNN(n_chars, hidden_size, n_chars, n_layers)).cuda()

这是full code .

不幸的是，DataParallel要求输入将batch_size作为第一个维度，但GRU函数期望隐藏张量将batch_size作为第二个维度:

output, self.hidden = self.GRU(input, self.hidden)

代码原样抛出以下错误(请注意打印输出显示编码器在 4 个 GPU 上正确执行):

...
forward function: encoding input of shape: (16L, 1L)
forward function: encoding input of shape: (16L, 1L)
forward function: encoding input of shape: (16L,
forward function: encoding input of shape:

forward function: GRU processing input of shape:
1L)
 ( (16L, 16L1L, 1L), 100L)
forward function: GRU processing input of shape:
 (16L, 1L,
forward function: GRU processing input of shape:100L)
 (16L
forward function: GRU processing input of shape:, 1L, 100L) (
16L, 1L, 100L)

Traceback (most recent call last):
  File "gru2.py", line 166, in <module>
    output = net(c, batch_size)
  File "/root/miniconda2/lib/python2.7/site-packages/torch/nn/modules/module.py", line 206, in __call__
    result = self.forward(*input, **kwargs)
  File "/root/miniconda2/lib/python2.7/site-packages/torch/nn/parallel/data_parallel.py", line 61, in forward
    outputs = self.parallel_apply(replicas, inputs, kwargs)
  File "/root/miniconda2/lib/python2.7/site-packages/torch/nn/parallel/data_parallel.py", line 71, in parallel_apply
    return parallel_apply(replicas, inputs, kwargs)
  File "/root/miniconda2/lib/python2.7/site-packages/torch/nn/parallel/parallel_apply.py", line 45, in parallel_apply
    raise output
RuntimeError: Expected hidden size (2, 16L, 100), got (2L, 64L, 100L)

此处模型有 2 层，batch_size=64，hidden_size = 100。

如何在前向函数中并行化 GRU 操作？

最佳答案

您可以简单地设置参数dim=1，例如

net = torch.nn.DataParallel(RNN(n_chars, hidden_size, n_chars, n_layers), dim=1).cuda()

关于torch - 如何使用 DataParallel 并行化 Pytorch 中的 RNN 函数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44595338/

25

4

0

文章推荐： c# - 在 Entity Framework 6 中使用来自多个线程的单个上下文

文章推荐： Angular 在更改时将 ngModel 传递给组件

文章推荐： django - 在 Django 管理中漂亮地打印 django.db.models.JSONField？

文章推荐： R:构建一个简单的命令行绘图工具/捕获窗口关闭事件

torch - 将我的自定义损失函数添加到 torch
我想向 Torch 添加一个损失函数，用于计算预测值和目标值之间的编辑距离。有没有一种简单的方法来实现这个想法？还是我必须编写自己的具有向后和向前功能的类？最佳答案如果您的标准可以表示为现有模
torch - torch 中的列总和
我如何沿着 torch 中的列求和？我有一个 128*1024 的张量，我想通过对所有行求和得到一个 1*1024 的张量。例如:一个: 1 2 3 4 5 6 我想要b 5 7 9 最佳答案为此
python-3.x - torch.mm、torch.matmul 和 torch.mul 有什么区别？
阅读pytorch文档后，我仍然需要帮助来理解torch.mm、torch.matmul和torch.mul之间的区别.由于我不完全理解它们，我无法简明扼要地解释这一点。 B = torch.tens
torch - Torch 中的 setNumInputDims 应该做什么？
minibatch = torch.Tensor(5, 2, 3,5) m = nn.View(-1):setNumInputDims(1) m:forward(minibatch) 给出一个大小
torch - PyTorch 和 Torch 是什么关系？
有两个 PyTorch 存储库: https://github.com/hughperkins/pytorch https://github.com/pytorch/pytorch 第一个显然需要 T
torch - PyTorch : error message "torch has no [...] member"
晚上好，我刚刚安装了 PyTorch 0.4.0，我正在尝试执行第一个教程“什么是 PyTorch？” 我编写了一个 Tutorial.py 文件，我尝试使用 Visual Studio Code
torch - 如何将列表或 numpy 数组转换为一维 torch 张量？
我有一个浮点值列表(或一个 numpy 数组)。我想创建一个包含所有这些值的一维 torch 张量。我可以创建 torch 张量并运行循环来存储值。但我想知道有没有什么办法，我可以使用列表或数组中的
python - 如何根据另一个 torch 张量中的索引更改 torch 张量中的某些值？
这是我在将 convertinf DQN 转换为 Double DQN 来解决 cartpole 问题时遇到的问题。我快要弄清楚了。 tensor([0.1205, 0.1207, 0.1197, 0
python - torch.softmax 和 torch.sigmoid 在二进制情况下不等价
鉴于: x_batch = torch.tensor([[-0.3, -0.7], [0.3, 0.7], [1.1, -0.7], [-1.1, 0.7]]) 然后申请 torch.sigmoid(
python - 如何将 torch int64 转换为 torch LongTensor？
我正在学习一门类(class)，该类(class)使用已弃用的 PyTorch 版本，该版本不会根据需要将 torch.int64 更改为 torch.LongTensor。当前引发错误的代码部分是:
python - torch 断言错误 : Torch not compiled with CUDA enabled
我正在尝试从 this repo 运行代码.我通过将 main.py 中的第 39/40 行从更改为禁用了 cuda parser.add_argument('--type', default='to
python - torch.tensor 和 torch.Tensor 有什么区别？
从 0.4.0 版本开始，可以使用 torch.tensor 和 torch.Tensor 有什么区别？提供这两个非常相似且令人困惑的替代方案的原因是什么？最佳答案在 PyTorch 中，torc
python - torch.stack() 和 torch.cat() 函数有什么区别？
用于强化学习的 OpenAI REINFORCE 和 actor-critic 示例具有以下代码: REINFORCE : policy_loss = torch.cat(policy_loss).s
python - torch ，属性错误: module 'torch' has no attribute 'Tensor'
我在装有 CentOS Linux 7.3.1611(核心)操作系统的计算机上使用 Python 3.5.1。我正在尝试使用 PyTorch 并开始使用 this tutorial . 不幸的是，示
python - torch torch .load ModuleNotFoundError : No module named 'utils'
我正在尝试使用 torch.load 加载预训练模型。我收到以下错误: ModuleNotFoundError: No module named 'utils' 我已通过从命令行打开它来检查我使用的
r - 在 R 包 "torch"中定义 Torch 类
这篇文章与我之前的 How to define a Python Class which uses R code, but called from rTorch? 有关. 我在 R ( https:/
python - torch.manual_seed 是否包含 torch.cuda.manual_seed_all 的操作？
是否torch.manual_seed包括torch.cuda.manual_seed_all的操作? 如果是，我们可以使用 torch.manual_seed设置种子。否则我们应该调用这两个函数。
pytorch - `torch.Tensor` 和 `torch.cuda.Tensor` 的区别
我们可以使用 torch.Tensor([1., 2.], device='cuda') 在 GPU 上分配张量.使用这种方式而不是torch.cuda.Tensor([1., 2.])有什么不同吗？
python - PyTorch 内存模型 : "torch.from_numpy()" vs "torch.Tensor()"
我正在尝试深入了解 PyTorch 张量内存模型的工作原理。 # input numpy array In [91]: arr = np.arange(10, dtype=float32).resha
python - 尽管安装了 anaconda 解释器和 torch ，但无法在 vscode 中导入 torch
我同时安装了 python38,37 和 anaconda，操作系统 - win10,x64。我无法在 py38,37 中安装 torch - 但在 anaconda 中安装了它。系统环境变量“路

首页

博学

6Ren·AI

商城

torch - 如何使用 DataParallel 并行化 Pytorch 中的 RNN 函数