深度学习（九）——神经网络：最大池化的作用

转载作者：我是一只小鸟更新时间：2023-07-21 22:33:35

31

4

1、 torch.nn中Pool layers的介绍

官网链接:

https://pytorch.org/docs/stable/nn.html#pooling-layers 。

1. nn.MaxPool2d介绍

nn.MaxPool2d是在进行图像处理时，Pool layers最常用的函数。

官方文档： MaxPool2d — PyTorch 2.0 documentation 。

（1）torch.nn.MaxPool2d类

                        
                          class torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)

（2）参数介绍

kernel_size(int or tuple) : 用于设置一个取最大值的窗口，如设置为3，那么会生成一个3×3的窗口。
stride(int or tuple) : 默认值为kernel_size，步幅，和卷积层中的stride一样。
padding(int or tuple) : 填充图像，默认填充的值为0 。
dilation(int) : 空洞卷积，即卷积核之间的距离。如卷积核的尺寸为3×3，dilation为1，那么返回一个大小为5×5的卷积核，卷积核每个元素与上下左右的元素之间空一格。
return_indices(bool) : 一般用的很少，不做介绍。
ceil_mode(bool) : 默认为False。为True时，输出的shape使用 ceil 格式（向上取整，即进一）；为False时，输出的shape使用 floor 格式（向下取整）.

2、最大池化操作

1. 最大池化操作举例（理论介绍）

假设有一个5×5的图像和一个3×3的池化核（kenel_size=3），如下图。池化过程就是将池化核与图像进行匹配。下面介绍最大池化的具体操作.

首先用池化核覆盖图像，如下图。然后取到最大值，作为一个输出.
上图为第一次最大池化操作，最大值为2。将2作为一个输出，如下图.
由于本例未对stride进行设置，故stride采取默认值，即 stride=kernel_size=3 ，池化核移动如下图（移动方式与上上文中提到的卷积核移动方式相同，不再赘述）。由于池化核移动已超出范围，要不要取这3×2部分的最大值，取决于call_mode的值，若 ceil_mode=True ，则取最大值，即输出3；若 ceil_mode=False ，则不取这部分的值，即这一步不进行池化操作.
- 假设 ceil_mode=True ，经过最大池化操作后，输出的结果如下图.
- 假设 ceil_mode=False ，经过最大池化操作后，输出的结果如下图.

2. 操作前后的图像大小计算公式

跟卷积操作的计算公式一样。具体如下:

参数说明:

N: 图像的batch_size 。
C: 图像的通道数。
H: 图像的高。
W: 图像的宽。

计算过程:

Input: \( (N,C_{in},H_{in},W_{in})\) or \((C_{in},H_{in},W_{in})\) 。
Output: \((N,C_{out},H_{out},W_{out})\) or \((C_{out},H_{out},W_{out})\) 。
- 其中有:
  
  \(H_{out}=⌊\frac{H_{in}+2×padding[0]−dilation[0]×(kernel\_size[0]−1)−1}{stride[0]}+1⌋\) 。
  
  \(W_{out}=⌊\frac{W_{in}+2×padding[1]−dilation[1]×(kernel\_size[1]−1)−1}{stride[1]}+1⌋\) 。

看论文的时候，有些比如像padding这样的参数不知道，就可以用这条公式去进行推导。

3. 最大池化操作代码举例

依然选取上面的例子，进行编程.

                        
                          import torch
from torch import nn
from torch.nn import MaxPool2d
input=torch.tensor([[1,2,0,3,1],
                    [0,1,2,3,1],
                    [1,2,1,0,0],
                    [5,2,3,1,1],
                    [2,1,0,1,1]],dtype=torch.float32)   #输入图像数据;与卷积操作不同的是，最大池化操作要求输入的图像数据是浮点数，而不是整数(为整数第23行会报错)
input=torch.reshape(input,(-1,1,5,5))     #构造图像数据，使其符合输入标准，即分别为（输入batch_size待定，1通道，大小为5×5）
print(input.shape)  #[Run] torch.Size([1, 1, 5, 5])；数据格式符合输入标准

#构造神经网络
class Demo(nn.Module):
    def __init__(self):
        super(Demo,self).__init__()
        self.maxpool1=MaxPool2d(kernel_size=3,ceil_mode=True)  #设置最大池化函数，这里以ceil_mode=True为例

    def forward(self,input):
        output=self.maxpool1(input)  #将输入的数据（input）进行最大池化草子哦
        return output

demo=Demo()  #创建神经网络
output=demo(input)
print(output)
"""
[Run]
tensor([[[[2., 3.],
          [5., 1.]]]])

符合前面ceil_mode=True例子的输出结果一致
"""

4. 为什么要进行最大池化（最大池化的作用）

最大程度地保留输入特征，并使数据量减小。
上述例子中输入图像为5×5，经过最大池化操作之后变成了3×3，甚至为1×1。使得图像特征得以保留，而数据量大大减少了，对整个网络来说参数减少了，运算速度也变快了。
打个比方，这就像看视频的时候，高清（输入图像）变（经过最大池化操作）标清（输出数据）。

使用具体图片示例，介绍最大池化的作用:

                        
                          from torch import nn
from torch.nn import MaxPool2d
import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

dataset=torchvision.datasets.CIFAR10("./dataset",train=False,download=True,transform=torchvision.transforms.ToTensor())
dataloder=DataLoader(dataset,batch_size=64)

#构造神经网络
class Demo(nn.Module):
    def __init__(self):
        super(Demo,self).__init__()
        self.maxpool1=MaxPool2d(kernel_size=3,ceil_mode=True)  #设置最大池化函数，这里以ceil_mode=True为例

    def forward(self,input):
        output=self.maxpool1(input)  #将输入的数据（input）进行最大池化草子哦
        return output

demo=Demo()  #创建神经网络

writer=SummaryWriter("logs_maxpool")
step=0

for data in dataloder:
    imgs,targets=data
    writer.add_images("input",imgs,step)
    output=demo(imgs)
    writer.add_images("output",output,step)
    step+=1
writer.close()

对比输入输出，可以看出图像更糊了。

最后此篇关于深度学习（九）——神经网络：最大池化的作用的文章就讲到这里了,如果你想了解更多关于深度学习（九）——神经网络：最大池化的作用的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

31

4

0

文章推荐：基于GPT搭建私有知识库聊天机器人（六）仿chatGPT打字机效果

文章推荐：关于推动可追溯代码来源的计划

文章推荐：我真的，AI框架的编程范式怎么理解？

文章推荐： Avalonia项目打包安装包

实例分析Try {} Catch{} 作用
今天有小伙伴给我留言问到，try{...}catch(){...}是什么意思？它用来干什么？简单的说他们是用来捕获异常的下面我们通过一个例子来详细讲解下
html - 列表社交媒体链接的 ARIA 作用
我正在努力提高网站的可访问性，但我不知道如何在页脚中标记社交媒体链接列表。这些链接指向我在 facecook、twitter 等上的帐户。我不想用 role="navigation" 标记这些链接，因
java.util.Timer SystemTime 作用？
说现在是 6 点，我有一个 Timer 并在 10 点安排了一个 TimerTask。之后，System DateTime 被其他服务(例如 ntp)调整为 9 点钟。我仍然希望我的 TimerTas
php - 什么是 Doctrine hydration 作用？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
python入门:argparse浅析 nargs='+'作用
我就废话不多说了，大家还是直接看代码吧~ ? 1
Maven是什么?Maven的概念+作用+仓库的介绍+常用命令的详解
Maven系列1 1.什么是Maven？ Maven是一个项目管理工具，它包含了一个对象模型。一组标准集合，一个依赖管理系统。和用来运行定义在生命周期阶段中插件目标和逻辑。核心功能 Mav

首页

博学

6Ren·AI

商城

深度学习（九）——神经网络：最大池化的作用

1、 torch.nn中Pool layers的介绍

1. nn.MaxPool2d介绍

（1）torch.nn.MaxPool2d类

（2）参数介绍

2、最大池化操作

1. 最大池化操作举例（理论介绍）

2. 操作前后的图像大小计算公式

3. 最大池化操作代码举例

4. 为什么要进行最大池化（最大池化的作用）

首页

博学

6Ren·AI

商城

深度学习（九）——神经网络：最大池化的作用

﻿1、 torch.nn中Pool layers的介绍

1. nn.MaxPool2d介绍

（1）torch.nn.MaxPool2d类

（2）参数介绍

2、最大池化操作

1. 最大池化操作举例（理论介绍）

2. 操作前后的图像大小计算公式

3. 最大池化操作代码举例

4. 为什么要进行最大池化（最大池化的作用）

1、 torch.nn中Pool layers的介绍