python - 奇数的最大池化可能吗？-6ren

python - 奇数的最大池化可能吗？

转载作者：行者123 更新时间：2023-12-03 23:47:09

26

4

我正在学习 Udacity DeepLearning Nanodegree 并致力于自动编码器迷你项目。我不明白解决方案，也不明白如何自己检查。所以这是2个问题。

我们从 28*28 的图像开始。它们通过 3 个卷积层馈送，每个卷积层的填充为 1，每个卷积层的最大池化为原始尺寸的一半。我不明白的是最后一个元素？当然，2 轮 maxpooling (28/2)/2 给出 7，因此进一步的 maxpooling 应该是不可能的，因为它会导致奇数。有人可以向我解释为什么会这样吗？要复制的代码在这里:
'''

import torch
import numpy as np
from torchvision import datasets
import torchvision.transforms as transforms

# convert data to torch.FloatTensor
transform = transforms.ToTensor()

# load the training and test datasets
train_data = datasets.MNIST(root='data', train=True,
                                   download=True, transform=transform)
test_data = datasets.MNIST(root='data', train=False,
                                  download=True, transform=transform)

# Create training and test dataloaders
num_workers = 0
# how many samples per batch to load
batch_size = 20

# prepare data loaders
train_loader = torch.utils.data.DataLoader(train_data, batch_size=batch_size, num_workers=num_workers)
test_loader = torch.utils.data.DataLoader(test_data, batch_size=batch_size, num_workers=num_workers)

import torch.nn as nn
import torch.nn.functional as F

# define the NN architecture
class ConvDenoiser(nn.Module):
    def __init__(self):
        super(ConvDenoiser, self).__init__()
        ## encoder layers ##
        # conv layer (depth from 1 --> 32), 3x3 kernels
        self.conv1 = nn.Conv2d(1, 32, 3, padding=1)  
        # conv layer (depth from 32 --> 16), 3x3 kernels
        self.conv2 = nn.Conv2d(32, 16, 3, padding=1)
        # conv layer (depth from 16 --> 8), 3x3 kernels
        self.conv3 = nn.Conv2d(16, 8, 3, padding=1)
        # pooling layer to reduce x-y dims by two; kernel and stride of 2
        self.pool = nn.MaxPool2d(2, 2)

        ## decoder layers ##
        # transpose layer, a kernel of 2 and a stride of 2 will increase the spatial dims by 2
        self.t_conv1 = nn.ConvTranspose2d(8, 8, 3, stride=2)  # kernel_size=3 to get to a 7x7 image output
        # two more transpose layers with a kernel of 2
        self.t_conv2 = nn.ConvTranspose2d(8, 16, 2, stride=2)
        self.t_conv3 = nn.ConvTranspose2d(16, 32, 2, stride=2)
        # one, final, normal conv layer to decrease the depth
        self.conv_out = nn.Conv2d(32, 1, 3, padding=1)


    def forward(self, x):
        ## encode ##
        # add hidden layers with relu activation function
        # and maxpooling after
        x = F.relu(self.conv1(x))
        x = self.pool(x)
        # add second hidden layer
        x = F.relu(self.conv2(x))
        x = self.pool(x)
        # add third hidden layer
        x = F.relu(self.conv3(x))
        x = self.pool(x)  # compressed representation

        ## decode ##
        # add transpose conv layers, with relu activation function
        x = F.relu(self.t_conv1(x))
        x = F.relu(self.t_conv2(x))
        x = F.relu(self.t_conv3(x))
        # transpose again, output should have a sigmoid applied
        x = F.sigmoid(self.conv_out(x))

        return x

# initialize the NN
model = ConvDenoiser()
print(model)

我想尝试通过手动将单个图像传递给图层来理解这一点，并查看结果是什么，但这导致了错误。有人可以向我解释我如何看到穿过层的形状吗？代码有点乱，但我把它留在那里，所以你可以看到我的尝试。

dataiter = iter(train_loader)
images, labels = dataiter.next()
# images = images.numpy()

# get one image from the batch
# img = np.squeeze(images[0])
img=images[0]

#create hidden layer
conv1 = nn.Conv2d(1, 32, 3, padding=1)  

# z=torch.from_numpy(images[0])
z1=conv1(img)

感谢您能给我的任何见解。
谢谢，
J

最佳答案

关于你的第一个问题:
您可以在 documentation 中阅读如何计算最大池化的输出形状。您可以使用带或不带填充的偶数步最大池化奇形张量。您需要注意可能丢失某些像素的边界。

关于你的第二个问题:
您的模型需要 4D 输入:batch-channel-height-width。
通过仅从批次 ( img=images[0] ) 中选择一张图像，您可以消除批次维度，最终只有一个 3D 张量。
要解决此问题:

img=images[0:1, ...]  # select first image, but leave batch dimension as a singleton

关于python - 奇数的最大池化可能吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61983630/

26

4

0

文章推荐： python - PyTorch 中多输出回归问题的 RMSE 损失

文章推荐： c# - C# 中的自动 HTML 标签补全

java程序输出偶数/奇数
我的任务是编写一个java程序，首先询问用户将输入多少个数字，然后输出输入的奇数和偶数个数。它限制为整数 0-100。我的问题是:我的代码中缺少什么？ import java.util.Scanner
VBA 奇数/模数
我正在寻找有关 VBA 脚本的帮助。我一直在试图弄清楚如何使用 mod 功能。这是我到目前为止所做的: Function AddOddNumbersWithMod(nr) Dim i, su
winapi - GetPrivateProfileString 奇数
我只是想从 .NET 调用 kernel32 中的 GetPrivateProfileString 和 GetPrivateProfileSection，但遇到了一些我不明白的奇怪问题。让我们从这个
Haskell - 检查位置是否为偶数/奇数
我需要做的是在列表中交替应用 2 个函数。例如: (*2) (-3) [4,5,6,7,8] 会导致[8,2,12,4,16] , 因为 4*2 , 5-3 , 6*2 , 7-3 , 8*2 ...
Javascript 函数检查偶数/奇数
我尝试在 JavaScript 中创建一个函数来判断一个数字是否为偶数，或者它是否是一个数字。我收到此错误: 这是 CodeCademy 中的类(class)。最佳答案您正在检查函数 isNaN
java - 奇数/偶数程序不打印任何内容
当我运行此命令时，不会打印任何内容，我尝试根据用户输入的内容打印一条消息，显示奇数或偶数。 import java.util.Scanner; public class Questions {
java - 如何用Java分析数字的偶数/奇数
我必须编写一个程序来读取 3 个数字(使用输入框)，并根据它们的值写入以下消息之一: 所有 3 个数字都是奇数或所有 3 个数字都是偶数或 2 个数字是奇数，1 个数字是偶数或 1 个数字是奇数
jQuery .load() 奇数
我正在构建一个谷歌图像搜索的示例。我有一个图像网格(搜索结果)。当单击其中一张图像时，我正在使用 jquery 创建的部分标记中加载 html 文档。奇怪的是，如果你查看开发人员工具，html 已加载
c - 在各自的行上打印偶数/奇数
我试图仅在偶数行上打印单词 * Even * ，而不包括第一行和第二行(最终不包括最后两行)，但它打印 15 行，然后在整个过程中随机打印 * Even * 。使用 6 表示宽度，使用 15 表示高度
c++ - 有效地检查整数的偶数/奇数
我有一个数学函数，它取决于由给出的三个变量 {n、a 和 b} {a = n+1, b=n} 当 n 为偶数时 {b = n+1, a=n} 当 n 为奇数时我的函数被调用了很多次，n 各不相同
MYSQL 检查子字符串中的偶数/奇数
我有一个查询，其中有一个条件来检查房间号是否为奇数/偶数。问题在于房间号与建筑物信息一起存储在字符串中。以下是数据库中数据的格式: ABC-0101A (Odd) ABC-0112B (Even
javascript - 编写递归函数来识别偶数/奇数
已关闭。这个问题是 not reproducible or was caused by typos 。目前不接受答案。这个问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-top
html - 如何用CSS划分内容的偶数、奇数？
我有一个包含类似内容的页面。 ################################# # __________________________ # # | |
html - 奇数 - 组的偶数背景颜色
这个问题在这里已经有了答案: Can I combine :nth-child() or :nth-of-type() with an arbitrary selector? (9 个回答) Ho
python - 使用按位运算而不是测试偶数/奇数
我正在尝试了解这个素数分解的特定解决方案(取自 http://rosettacode.org/wiki/Prime_decomposition#Python:_Using_floating_point
C 奇数 if 语句
我知道这可能是一个愚蠢而简单的问题，但我对编程还很陌生。我有以下关于我在一个程序中看到的 if 运算符的问题。这是代码: d= -12.4; if(d) printf("%d \n", abs
php - 奇数/偶数脚本有问题
我正在尝试制作一个脚本，根据天气情况输出用户名，他们被分配奇数或偶数值。我想我已经设法让奇数的工作，但偶数的不会输出。这是它的样子。 'commentid' 是确定将它们分配给奇数还是偶数的值。 ";
java - 奇数 NullPointerException
我的 NPE 的 Stacktrace 开始于: Caused by: java.lang.NullPointerException at pl.yourvision.crm.web.serv
linux - 在汇编中查找数字是偶数/奇数
我正在尝试查找给定数字(用户输入)是偶数还是奇数。 I'm simply applying AND operation on binary digits of a no. with 1, If the
java - 奇数/素数桶的可变范围字符串哈希函数
有谁知道用于可变范围的桶的哈希函数(对于字符串，如果它重要的话)，它总是奇数(或质数，如果需要的话)？本质上，我正在寻找一个散列函数，它将在 n 个桶上提供均匀分布，其中 n 是奇数(或质数，因为

首页

博学

6Ren·AI

商城

python - 奇数的最大池化可能吗？