pytorch - 使用 pytorch 验证卷积定理-6ren

pytorch - 使用 pytorch 验证卷积定理

转载作者：行者123 更新时间：2023-12-04 09:28:25

28

4

基本上这个定理的公式如下:

F(f*g) = F(f)xF(g)

我知道这个定理，但我只是无法使用 pytorch 重现结果。

下面是一个可重现的代码:

import torch
import torch.nn.functional as F

# calculate f*g
f = torch.ones((1,1,5,5))
g = torch.tensor(list(range(9))).view(1,1,3,3).float()
conv = F.conv2d(f, g, bias=None, padding=2)

# calculate F(f*g)
F_fg = torch.rfft(conv, signal_ndim=2, onesided=False)

# calculate F x G
f = f.squeeze()
g = g.squeeze()

# need to pad into at least [w1+w2-1, h1+h2-1], which is 7 in our case.
size = f.size(0) + g.size(0) - 1 

f_new = torch.zeros((7,7))
g_new = torch.zeros((7,7))

f_new[1:6,1:6] = f
g_new[2:5,2:5] = g

F_f = torch.rfft(f_new, signal_ndim=2, onesided=False)
F_g = torch.rfft(g_new, signal_ndim=2, onesided=False)
FxG = torch.mul(F_f, F_g)

print(FxG - F_fg)

这是 print(FxG - F_fg) 的结果

tensor([[[[[ 0.0000e+00,  0.0000e+00],
       [ 4.1426e+02,  1.7270e+02],
       [-3.6546e+01,  4.7600e+01],
       [-1.0216e+01, -4.1198e+01],
       [-1.0216e+01, -2.0223e+00],
       [-3.6546e+01, -6.2804e+01],
       [ 4.1426e+02, -1.1427e+02]],

      ...

      [[ 4.1063e+02, -2.2347e+02],
       [-7.6294e-06,  2.2817e+01],
       [-1.9024e+01, -9.0105e+00],
       [ 7.1708e+00, -4.1027e+00],
       [-2.6739e+00, -1.1121e+01],
       [ 8.8471e+00,  7.1710e+00],
       [ 4.2528e+01,  9.7559e+01]]]]])

你可以看到差异并不总是 0。

有人能告诉我为什么以及如何正确地做到这一点吗？

谢谢

最佳答案

所以我仔细研究了你到目前为止所做的事情。我已经确定了您代码中的三个错误来源。我将在这里尝试充分解决每个问题。
1. 复数运算
PyTorch 目前不支持复数乘法 (AFAIK)。 FFT 运算仅返回具有实部和虚部维度的张量。我们需要显式地编写复数乘法，而不是使用 torch.mul 或 * 运算符。

(a + ib) * (c + id) = (a*c - b*d) + i(a*d + b*c)

2.卷积的定义
CNN文献中经常使用的“卷积”的定义，实际上与讨论卷积定理时使用的定义不同。我不会详细介绍，但是 theoretical definition 在滑动和乘法之前翻转内核。相反，pytorch、tensorflow、caffe 等中的卷积操作不会进行这种翻转。
为了解决这个问题，我们可以在应用 FFT 之前简单地翻转 g(水平和垂直)。
3. anchor 定位置
假设使用卷积定理时的 anchor 是填充的 g 的左上角。同样，我不会详细介绍这一点，但这是数学计算的方式。

举个例子，第二点和第三点可能更容易理解。假设您使用了以下 g

[1 2 3]
[4 5 6]
[7 8 9]

而不是 g_new 是

[0 0 0 0 0 0 0]
[0 0 0 0 0 0 0]
[0 0 1 2 3 0 0]
[0 0 4 5 6 0 0]
[0 0 7 8 9 0 0]
[0 0 0 0 0 0 0]
[0 0 0 0 0 0 0]

它实际上应该是

[5 4 0 0 0 0 6]
[2 1 0 0 0 0 3]
[0 0 0 0 0 0 0]
[0 0 0 0 0 0 0]
[0 0 0 0 0 0 0]
[0 0 0 0 0 0 0]
[8 7 0 0 0 0 9]

我们垂直和水平翻转内核，然后应用循环移位，使内核的中心位于左上角。

我最终重写了您的大部分代码并对其进行了一些概括。最复杂的操作是正确定义 g_new。我决定使用网格和模运算来同时翻转和移动索引。如果这里的某些内容对您没有意义，请发表评论，我会尽力澄清。

import torch
import torch.nn.functional as F

def conv2d_pyt(f, g):
    assert len(f.size()) == 2
    assert len(g.size()) == 2

    f_new = f.unsqueeze(0).unsqueeze(0)
    g_new = g.unsqueeze(0).unsqueeze(0)

    pad_y = (g.size(0) - 1) // 2
    pad_x = (g.size(1) - 1) // 2

    fcg = F.conv2d(f_new, g_new, bias=None, padding=(pad_y, pad_x))
    return fcg[0, 0, :, :]

def conv2d_fft(f, g):
    assert len(f.size()) == 2
    assert len(g.size()) == 2

    # in general not necessary that inputs are odd shaped but makes life easier
    assert f.size(0) % 2 == 1
    assert f.size(1) % 2 == 1
    assert g.size(0) % 2 == 1
    assert g.size(1) % 2 == 1

    size_y = f.size(0) + g.size(0) - 1
    size_x = f.size(1) + g.size(1) - 1

    f_new = torch.zeros((size_y, size_x))
    g_new = torch.zeros((size_y, size_x))

    # copy f to center
    f_pad_y = (f_new.size(0) - f.size(0)) // 2
    f_pad_x = (f_new.size(1) - f.size(1)) // 2
    f_new[f_pad_y:-f_pad_y, f_pad_x:-f_pad_x] = f

    # anchor of g is 0,0 (flip g and wrap circular)
    g_center_y = g.size(0) // 2
    g_center_x = g.size(1) // 2
    g_y, g_x = torch.meshgrid(torch.arange(g.size(0)), torch.arange(g.size(1)))
    g_new_y = (g_y.flip(0) - g_center_y) % g_new.size(0)
    g_new_x = (g_x.flip(1) - g_center_x) % g_new.size(1)
    g_new[g_new_y, g_new_x] = g[g_y, g_x]

    # take fft of both f and g
    F_f = torch.rfft(f_new, signal_ndim=2, onesided=False)
    F_g = torch.rfft(g_new, signal_ndim=2, onesided=False)

    # complex multiply
    FxG_real = F_f[:, :, 0] * F_g[:, :, 0] - F_f[:, :, 1] * F_g[:, :, 1]
    FxG_imag = F_f[:, :, 0] * F_g[:, :, 1] + F_f[:, :, 1] * F_g[:, :, 0]
    FxG = torch.stack([FxG_real, FxG_imag], dim=2)

    # inverse fft
    fcg = torch.irfft(FxG, signal_ndim=2, onesided=False)

    # crop center before returning
    return fcg[f_pad_y:-f_pad_y, f_pad_x:-f_pad_x]


# calculate f*g
f = torch.randn(11, 7)
g = torch.randn(5, 3)

fcg_pyt = conv2d_pyt(f, g)
fcg_fft = conv2d_fft(f, g)

avg_diff = torch.mean(torch.abs(fcg_pyt - fcg_fft)).item()

print('Average difference:', avg_diff)

这给了我

Average difference: 4.6866085767760524e-07

这非常接近于零。我们没有得到完全为零的原因仅仅是由于浮点错误。

关于pytorch - 使用 pytorch 验证卷积定理，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60561933/

28

4

0

文章推荐： R:计算嵌套列表的每个子列表中存在多少向量元素

文章推荐： wolfram-mathematica - 我如何获得函数的反函数？

文章推荐： vim - 您可以查询vim中的变量/设置设置为什么吗？

文章推荐：将格式化数据读入 R

java - 单元测试 - 定理
所以，我看过一个关于 TDD 的视频，其中演示者说，你应该只对类的一部分进行单元测试，即为外部世界提供一些东西。他提到这很好，因为这种方法可以确保类遵守“契约(Contract)”，因此它履行了其职责
Redis 可用性和 CAP 定理
在CAP定理中，Redis被指定为缺乏可用性(具有分区容错性和一致性)的数据库。但是在很多地方，Redis 被认为是一种高可用的键值存储。什么是对的？如果您能提供深入的答案，我将不胜感激。最佳答
function - 幂的 Agda 定理
我正在尝试证明以下内容: 1-pow : ∀ {n : ℕ} → 1 pow n ≡ 1 1-pow {zero} = refl 1-pow {suc x} = {!!} 我是 Adga 的新手，甚
java - 分离 Axis 定理
我正在努力解决这个问题 - 我实际上已经找了一整天了! 我想我理解它背后的主要概念，但我正在努力弄清楚创建将形状投影到其上的 Axis 所需的数学？因此，如果我有一个矩形，我会找出每个点，然后使用它
function - 幂的 Agda 定理
我试图证明以下内容: 1-pow : ∀ {n : ℕ} → 1 pow n ≡ 1 1-pow {zero} = refl 1-pow {suc x} = {!!} 我是 Adga 的新手，甚至不
java - 如何在任何给定的三角形上使用 Pick 定理
所以我想计算任何给定三角形内的点数。我知道我必须使用 Pick 定理，但我的代码最终变得非常长，其中包含用于测试每种情况的 if-else if 语句的数量。我一直以此为指导 How many int
database - CAP 定理 - 异步写入和一致性
当说系统是 CP(一致性和分区)时，这是否意味着我们不能在复制的数据节点之间使用异步同步，并且每次写入都必须同步(甚至是事务性)复制？据我了解，一致性意味着对于每次写入，后续读取(来自任何节点)都将
database - CAP 定理 - 可用性和分区容错性
虽然我试图理解CAP中的“可用性”(A)和“分区容忍度”(P)，但我发现很难理解各种文章的解释。我感觉 A 和 P 可以走到一起(我知道事实并非如此，这就是我无法理解的原因!)。深入浅出，A和P是
nosql - foundationdb 究竟如何击败 CAP 定理？
foundationdb 声明在 consistency 上吗？有效的？ FoundationDB provides the strongest possible consistency model,
Azure、SLA 和 CAP 定理
Azure 本身是 PaaS，而不是 IaaS。你同意？ MS保证99%的可用性和强一致性。您可以在此处找到 MS SLA:http://www.microsoft.com/windowsazure/
python - Python 中的 Parseval 定理
我正试图掌握 Python 的 fft 功能，我偶然发现的一件奇怪的事情是 Parseval's theorem似乎不适用，因为它现在给出了大约 50 的差异，而它应该是 0。 import nump
coq - 在 coq 中使用已经证明的引理/定理/推论
我正在尝试在 Coq 中进行证明，并且我想使用我已经定义和证明的引理。以下代码可以吗？ Lemma conj_comm: forall A B : Prop, A /\ B -> B /\ A. Pr
isabelle - 搜索 Isabelle 的一般定义、定理、函数等的最佳方法是什么？
我试图通过 Isabelle(定理证明者)的 Isar 章节，第一个陈述是: lemma "¬ surj(f :: 'a ⇒ 'a set)" 我想了解什么是常数surj曾是。我知道查找定理很容易:
high-availability - Aerospike 如何处理 CAP 定理？
我想在分布式系统中使用 aerospike。 Aerospike 官方文档说: Aerospike 系统被归类为 AP 任何人都可以照亮它吗？ Aerospike如何保证分布式环境下的AP模式。最佳
r - 在 bookdown book 的末尾创建几个索引定义/定理
这code example to generate a list of definitions对我有用，但只适用于一个索引列表。每当我尝试添加另一个列表(例如，对于定理)时，只有在设置垃圾中最后定义的
database - 根据 CAP 定理，memcached 属于哪一类？
我打算使用 memcached 数据库。根据我的要求，高性能(速度)和可用性是最高优先级的。(一致性可以在某种程度上进行交易)请建议使用合适的数据库。我正在关注 CAP Theorem . 按类别我
mysql - CAP 定理 - 为什么 Mysql 是 CA
根据 CAP Consistency - All nodes gave the same data Availability means the ability to access the clust
rdbms - 为什么 RDBMS 被认为适用于 CAP 定理 (CA)
如果我正确理解了 CAP 定理，可用性意味着即使节点出现故障，集群也会继续运行。我见过很多人(http://blog.nahurst.com/tag/guide)将RDBMS列为CA，但我不明白RB
hadoop - Hadoop 的 HDFS 高可用性特性如何影响 CAP 定理？
根据我目前所读到的有关 CAP 定理的所有内容，没有分布式系统可以同时提供这三者:可用性、一致性和分区容错性。现在，Hadoop 2.x 引入了一项新功能，可以对其进行配置以消除 hadoop 集群
python - 如何规范化 numpy(实数)傅里叶变换的频谱，以便应用 parseval 定理？
目前，我正在考虑拍摄图像及其光谱。现在 Parceval 的定理说两者应该具有相等的能量。然而，当我尝试在某些图像上对此进行测试时，numpy 真实 FFT 函数似乎并非如此。这是我用于测试的代码:

首页

博学

6Ren·AI

商城

pytorch - 使用 pytorch 验证卷积定理