pytorch - PyTorch 的 Conv2d 真的没有 padding=same 选项吗？-6ren

pytorch - PyTorch 的 Conv2d 真的没有 padding=same 选项吗？

转载作者：行者123 更新时间：2023-12-04 11:11:47

28

4

我目前正在构建一个可以处理时间序列数据的卷积神经网络 (CNN)。
更具体地说，数据是形状(100, 40)的财务数据。 , 与 100意味着 100 个时间戳和 40意味着 40 个功能。
我使用的 CNN 使用非对称内核大小(即 1 x 2 和 4 x 1 )和非对称步幅(即 1 x 2 用于 1 x 2 层和 1 x 1 用于 |9104| 层)。
为了保持高度尺寸留4 x 1 ，我需要对数据应用一些填充。我正在研究如何做到这一点，并注意到使用 TensorFlow 或 Keras 的人只是做 100 ，但根据我发现的许多资源，包括 this thread on Github，该选项在 PyTorch 中显然不可用。 .
我发现的是，根据 some answers in this question还有 this answer on the PyTorch discussion forum ，我可以手动计算我需要如何填充我的数据并且可以使用 padding='same' 解决我的问题，因为这似乎很正常 torch.nn.ZeroPad2d 层不支持非对称填充(我相信我需要的总填充高度为 3，宽度为 0)。
我为测试这一点而编写的实验代码是这样的:

import torch
import torch.nn as nn

conv = nn.Conv2d(1, 1, kernel_size=(4, 1))
pad = nn.ZeroPad2d((0, 0, 2, 1)) # Add 2 to top and 1 to bottom.

x = torch.randint(low=0, high=9, size=(100, 40))
x = x.unsqueeze(0).unsqueeze(0)

y = pad(x)

x.shape # (1, 1, 100, 40)
y.shape # (1, 1, 103, 40)

print(conv(x.float()).shape)
print(conv(y.float()).shape)

# Output
# x -> (1, 1, 97, 40)
# y -> (1, 1, 100, 40)

如您所见，在维度大小保持不变的意义上，它确实有效。然而，我一直想知道是否真的没有 torch.nn.Conv2d选项在那里？另外，我们如何知道是将 padding 2 应用到顶部还是底部？
谢谢你。

编辑
这有点晚了，但如果有人好奇我是如何解决这个问题的，我基本上手动添加了填充以模拟 padding='same'选项。

最佳答案

前段时间我遇到了同样的问题，所以我使用 ZeroPad2d 自己实现了它。像你想要做的那样分层。这是正确的公式:

from functools import reduce
from operator import __add__

kernel_sizes = (4, 1)

# Internal parameters used to reproduce Tensorflow "Same" padding.
# For some reasons, padding dimensions are reversed wrt kernel sizes,
# first comes width then height in the 2D case.
conv_padding = reduce(__add__, 
    [(k // 2 + (k - 2 * (k // 2)) - 1, k // 2) for k in kernel_sizes[::-1]])

pad = nn.ZeroPad2d(conv_padding)
conv = nn.Conv2d(1, 1, kernel_size=kernel_sizes)

print(x.shape) # (1, 1, 103, 40)
print(conv(y.float()).shape) # (1, 1, 103, 40)

另外，正如@akshayk07 和@Separius 所提到的，我可以确认是pytorch 的动态特性使它变得困难。 Here是 Pytorch 开发人员关于这一点的帖子。

关于pytorch - PyTorch 的 Conv2d 真的没有 padding=same 选项吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58307036/

28

4

0

文章推荐： haskell - 使 Applicative 成为 Monad 所需的 'minimum' 是什么？

文章推荐： python - pip 下载而不执行 setup.py

文章推荐： mysql - 何时使用 float 与十进制数

文章推荐： python - 如何为旧的 python 版本安装 python-distutils

c# - 将 IntPtr 转换为 Int64 : conv. u8 或 conv.i8？
我正在处理 ILGenerator使用 Expression 帮助发射 IL 片段的扩展.一切都很好，直到我处理整数转换部分。有些东西对我来说确实违反直觉，例如: 使用 conv.i8转换 Int32
node.js - 使用 Dialogflow Conv.Data 或 Conv.User.Storage 的简单计数器
我希望使用 Google 操作在 Firebase 函数的对话中创建一个 super 简单的计数器。 documentation推荐: app.intent('Default Welcome Inte
MYSQL CONV 从十六进制到十进制的问题
我有一些代码可以将数字从十六进制转换为十进制，并检查是否大于或等于。今天，我发现这并不总是有效，我也不知道为什么。我试过使用原始值，效果很好。比较工作之外的转换。 select case when
conv-neural-network - 理解什么是卷积神经网络中的权重共享
我目前正在尝试理解卷积神经网络中的权重共享到底是什么。据我所知，CNN 最初是作为一种减少连接输入和输出所需的连接数量的方法引入的，因为输入具有 3 个维度。按照这个逻辑，卷积减少其中一个维度，并
conv-neural-network - 卷积图输出维度
本文Let there be Color!实现CNN，属性如下: 图片大小:224x224 内核大小:3X3 步幅:2X2 填充:1x1 在论文中，他们提到输出层大小为 112X112 但使用公式 N
python - conv net 节省重量和新的测试集
我正在使用卷积网络进行图像分类。理论上有一些东西我不明白对于训练，我将数据分为 60% 训练/20% 验证/20% 测试当验证集上的指标最好时，我会节省重量(我在训练和验证集上具有相同的性能)。
conv-neural-network - 生成图像上的白点 CycleGAN
我正在尝试实现 cyclegan。然而，即使在 10 或 25 个 epoch 之后，我生成的图像上似乎总是出现白点。我想知道可能出了什么问题？我应该继续训练，问题就会消失吗？或者有任何关于如何解决这
conv-neural-network - keras 在每个时代都造成相同的损失
我是 keras 的新手。我在一个数据集上运行它，我的目标是减少 logloss。对于每个时代，它都给我相同的损失值。我很困惑我是否在正确的轨道上。例如: Epoch 1/5 91456/914
conv-neural-network - MaxPooling 是否减少过拟合？
我用较小的数据集训练了以下 CNN 模型，因此它确实过拟合: model = Sequential() model.add(Conv2D(32, kernel_size=(3,3), input_sh
pytorch - pytorch 中 conv 的默认权重初始值设定项是什么？
问题How to initialize weights in PyTorch?显示如何初始化 Pytorch 中的权重.但是，Conv 的默认权重初始值设定项是什么？和 Dense在 Pytorch
conv-neural-network - YOLOv3 SPP和YOLOv3的区别？
我找不到任何关于 YOLOv3 SPP 更好的解释 mAP比 YOLOv3。作者本人在他的 repo 中将 YOLOv3 SPP 声明为: YOLOv3 with spatial pyramid po
conv-neural-network - 在灰度图像网络上训练的 VGG16
我发现在(彩色)imagenet 数据库(如 .npy)上预训练的 VGG16 网络。是否有在可用的 imagenet 数据库灰度版本上预训练的 VGG16 网络？ (在灰色 1 channel 输入
conv-neural-network - CNN 给定训练数据的理想输入大小
CNN 的输入大小应该遵循训练数据的输入大小吗？例如，如果我的训练数据大小为 192 x 98，那么我的 CNN 的输入大小应该是多少？ 192×192？ 98×98？如果我使用 32x32 输入 C
python - 数据增强期间的 Keras CONV 训练似乎显示错误的批量大小和训练示例数量
我正在学习如何使用 Keras 和 CIFAR-10 数据集实现数据增强。我正在在线教程和这本书的帮助下学习Deep learning with Keras. 代码具体详情为here . 这是我的问题
tensorflow - 用于特征缩减的 Conv 1x1 配置
我在深度网络中使用 1x1 卷积来减少特征 x:Bx2CxHxW 到 BxCxHxW。我有三个选择: x -> Conv (1x1) -> Batchnorm-->ReLU。代码将为output =
python - Tensorflow:如何将 conv 层权重复制到另一个变量以用于强化学习？
我不确定这在 Tensorflow 中是否可行，我担心我可能不得不切换到 PyTorch。基本上，我有这一层: self.policy_conv1 = tf.layers.conv2d(inputs
node.js - conv.ask() 等待音频完成
我正在使用 actions-sdk 和 nodejs 构建一个“游戏”。对于此游戏，一项功能要求音频在接受用户输入之前完成。是否可以使用 conv.ask() 忽略文本意图的输入，直到音频完成？另外，
conv-neural-network - 我应该对训练集中存在的所有对象进行标记和训练吗(yolo darknet)
(yolo - 物体检测) 如果图像中有两只狗，而我在训练集中存在的所有图像中只对其中一只进行了训练，训练集中我没有标记和训练的其他狗是否会影响过程并导致将它们视为背景的一部分？我特别询问 yol
conv-neural-network - 如何在 PyTorch 中更改图片大小
我正在尝试 convert CNN Keras model对于使用 FER2013 数据集到 PyTorch 模型的情绪识别，我有以下错误: Traceback (most recent call l
c - 函数名 "conv"中的 "localeconv()"是什么意思？
函数名conv中的“localeconv()”是什么意思在标题？最佳答案 The HP-UX manual pages ，将 localeconv() 的用途总结为: localeconv()

首页

博学

6Ren·AI

商城

pytorch - PyTorch 的 Conv2d 真的没有 padding=same 选项吗？