gpt4 book ai didi

pytorch - 如何在 PyTorch 中合并 2D 卷积?

转载 作者:行者123 更新时间:2023-12-02 14:30:53 25 4
gpt4 key购买 nike

从线性代数我们知道线性算子是结合的。

在深度学习领域,这个概念被用来证明在 NN 层之间引入非线性的合理性,以防止出现俗称 linear lasagna 的现象。 ,(reference)。

在信号处理中,这也导致了一个众所周知的优化内存和/或运行时要求的技巧(reference)。

所以从不同的角度来看,合并卷积是一个非常有用的工具。如何用PyTorch实现?

最佳答案

如果我们有 y = x * a * b (其中 * 表示卷积,a, b 是您的内核),我们可以定义c = a * b,使得y = x * c = x * a * b如下:

import torch

def merge_conv_kernels(k1, k2):
"""
:input k1: A tensor of shape ``(out1, in1, s1, s1)``
:input k2: A tensor of shape ``(out2, in2, s2, s2)``
:returns: A tensor of shape ``(out2, in1, s1+s2-1, s1+s2-1)``
so that convolving with it equals convolving with k1 and
then with k2.
"""
padding = k2.shape[-1] - 1
# Flip because this is actually correlation, and permute to adapt to BHCW
k3 = torch.conv2d(k1.permute(1, 0, 2, 3), k2.flip(-1, -2),
padding=padding).permute(1, 0, 2, 3)
return k3

为了说明等效性,此示例将分别具有 900 个和 5000 个参数的两个内核组合成一个具有 28 个参数的等效内核:

# Create 2 conv. kernels
out1, in1, s1 = (100, 1, 3)
out2, in2, s2 = (2, 100, 5)
kernel1 = torch.rand(out1, in1, s1, s1, dtype=torch.float64)
kernel2 = torch.rand(out2, in2, s2, s2, dtype=torch.float64)

# propagate a random tensor through them. Note that padding
# corresponds to the "full" mathematical operation (s-1)
b, c, h, w = 1, 1, 6, 6
x = torch.rand(b, c, h, w, dtype=torch.float64) * 10
c1 = torch.conv2d(x, kernel1, padding=s1 - 1)
c2 = torch.conv2d(c1, kernel2, padding=s2 - 1)

# check that the collapsed conv2d is same as c2:
kernel3 = merge_conv_kernels(kernel1, kernel2)
c3 = torch.conv2d(x, kernel3, padding=kernel3.shape[-1] - 1)
print(kernel3.shape)
print((c2 - c3).abs().sum() < 1e-5)

注意: 等价假设我们有无限的数值分辨率。我认为有关于堆叠许多低分辨率浮点线性运算的研究,并表明网络从数值误差中获利,但我无法找到它。任何引用都值得赞赏!

关于pytorch - 如何在 PyTorch 中合并 2D 卷积?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58357815/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com