python - ConvNet 中的 col2im 实现-6ren

python - ConvNet 中的 col2im 实现

转载作者：行者123 更新时间：2023-11-30 22:10:21

26

4

我正在尝试仅使用 numpy 实现CNN。

在进行反向传播时，我发现我必须使用 col2im 来 reshape dx，所以我检查了 https://github.com/huyouare/CS231n/blob/master/assignment2/cs231n/im2col.py 的实现。 .

import numpy as np


def get_im2col_indices(x_shape, field_height, field_width, padding=1, stride=1):
  # First figure out what the size of the output should be
  N, C, H, W = x_shape
  assert (H + 2 * padding - field_height) % stride == 0
  assert (W + 2 * padding - field_height) % stride == 0
  out_height = (H + 2 * padding - field_height) / stride + 1
  out_width = (W + 2 * padding - field_width) / stride + 1

  i0 = np.repeat(np.arange(field_height), field_width)
  i0 = np.tile(i0, C)
  i1 = stride * np.repeat(np.arange(out_height), out_width)
  j0 = np.tile(np.arange(field_width), field_height * C)
  j1 = stride * np.tile(np.arange(out_width), out_height)
  i = i0.reshape(-1, 1) + i1.reshape(1, -1)
  j = j0.reshape(-1, 1) + j1.reshape(1, -1)

  k = np.repeat(np.arange(C), field_height * field_width).reshape(-1, 1)

  return (k, i, j)


def im2col_indices(x, field_height, field_width, padding=1, stride=1):
  """ An implementation of im2col based on some fancy indexing """
  # Zero-pad the input
  p = padding
  x_padded = np.pad(x, ((0, 0), (0, 0), (p, p), (p, p)), mode='constant')

  k, i, j = get_im2col_indices(x.shape, field_height, field_width, padding,
                               stride)

  cols = x_padded[:, k, i, j]
  C = x.shape[1]
  cols = cols.transpose(1, 2, 0).reshape(field_height * field_width * C, -1)
  return cols


def col2im_indices(cols, x_shape, field_height=3, field_width=3, padding=1,
                   stride=1):
  """ An implementation of col2im based on fancy indexing and np.add.at """
  N, C, H, W = x_shape
  H_padded, W_padded = H + 2 * padding, W + 2 * padding
  x_padded = np.zeros((N, C, H_padded, W_padded), dtype=cols.dtype)
  k, i, j = get_im2col_indices(x_shape, field_height, field_width, padding,
                               stride)
  cols_reshaped = cols.reshape(C * field_height * field_width, -1, N)
  cols_reshaped = cols_reshaped.transpose(2, 0, 1)
  np.add.at(x_padded, (slice(None), k, i, j), cols_reshaped)
  if padding == 0:
    return x_padded
  return x_padded[:, :, padding:-padding, padding:-padding]

pass

我预计当我将 X 放入 im2col_indices 时，并将该输出放回 col2im_indices 将返回相同的 X ，但事实并非如此。

我不明白 col2im 实际上是做什么的。

最佳答案

如果我是对的，输出不是相同的 X，因为 X 的每个单元格都转换为多个 col，并且在 im2col_indices 期间被相乘。

假设您有一个像这样的简单图像X

1 2 3 4 5 6 7 8 9

然后使用内核大小 3、步幅 1 和相同 填充对其进行转换，结果将是

0 0 0 0 1 2 0 4 5 0 0 0 1 2 3 4 5 6 0 0 0 2 3 0 5 6 0 0 1 2 0 4 5 0 7 8 1 2 3 4 5 6 7 8 9 2 3 0 5 6 0 8 9 0 0 4 5 0 7 8 0 0 0 4 5 6 7 8 9 0 0 0 5 6 0 8 9 0 0 0 0 * * * *

如您所见，第一个值为 1 的单元格显示在四个 col 中:0、1、3、4。

im2col_indices 首先将具有填充大小的图像初始化为零，然后将每个 col 添加到其中。关注第一个单元格，过程应该是这样的

1.零初始化图像

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

2.添加col 0

0 0 0 0 0 0 0 0 - - 0 0 0 0 0 0 0 0 0 0 0 1 2 - - 0 1 2 0 0 0 0 0 0 0 + 0 4 5 - - = 0 4 5 0 0 0 0 0 0 0 - - - - - 0 0 0 0 0 0 0 0 0 0 - - - - - 0 0 0 0 0

3.添加第1列

0 0 0 0 0 - 0 0 0 - 0 0 0 0 0 0 1 2 0 0 - 1 2 3 - 0 2 4 3 0 0 4 5 0 0 + - 4 5 6 - = 0 8 10 6 0 0 0 0 0 0 - - - - - 0 0 0 0 0 0 0 0 0 0 - - - - - 0 0 0 0 0

4.添加第3列

0 0 0 0 0 - - - - - 0 0 0 0 0 0 2 4 3 0 0 1 2 - - 0 3 6 3 0 0 8 10 6 0 + 0 4 5 - - = 0 12 15 6 0 0 0 0 0 0 0 7 8 - - 0 7 8 0 0 0 0 0 0 0 - - - - - 0 0 0 0 0

5.添加第4列

0 0 0 0 0 - - - - - 0 0 0 0 0 0 3 6 3 0 - 1 2 3 - 0 4 8 6 0 0 12 15 6 0 + - 4 5 6 - = 0 16 20 12 0 0 7 8 0 0 - 7 8 9 - 0 14 16 9 0 0 0 0 0 0 - - - - - 0 0 0 0 0

转换回来后，第一个单元格会乘以 4。对于这个简单的图像， col2im_indices(im2col_indices(X)) 应该给你

4 12 12 24 45 36 28 48 36

与原始图像相比，四个角单元1 3 7 9乘以4，四个边缘单元2 4 6 8乘以6，中心单元 5 乘以 9。

对于大图像，大多数单元格都会乘以 9，我认为这大致意味着你的学习率实际上比你想象的要大 9 倍。

关于python - ConvNet 中的 col2im 实现，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51703367/

26

4

0

文章推荐： c# - 进程句柄而不是进程的文件句柄

skype - Skype 如何在 imo.im 和 im+ 服务中工作？
Skype 如何在 imo.im 和 im+ 服务中工作？有什么猜测吗？我认为只有3种方式: 为服务器上的每个连接客户端运行多个 Skype 客户端副本为服务器上的每个客户端从 SkypeKit
java - 如何获取 google talk 聊天客户端的电子邮件(默认 IM)而不是公共(public) IM
目前我正在开发 XMPP Google talk 聊天应用程序。该应用程序运行良好，通过分析来自特定聊天客户端的传入数据包(消息)，我得到发件人的用户名(电子邮件)为“xxx@public.talk.
c++ - (Im) 使用可变参数模板完美转发
概要给定一个带有可变参数模板构造函数的类型，它将参数转发给一个实现类，是否可以限制使用 SFINAE 转发的类型？细节首先，考虑带有通用引用的构造函数的非可变参数情况。这里可以禁用通过 SFIN
im ok趣味聊天表情包大全超级火的聊天表情合集
一组人气很高的很火的聊天表情包又来啦，热门又很有趣的聊天表情哦，这组表情包的聊天使用频率也是超级的高的哦。
CMD/im (taskkill) 是做什么的？
我刚刚阅读了以下命令: taskkill /f /im something.exe 我读到了 /f强制关闭任务，但是 /im 做什么？做？最佳答案它告诉 taskkill下一个参数somethin
java - 如何通知即时消息 (IM) 应用程序的客户端有更新？
我曾遇到过有关此主题的不同问题，但是，没有一个能消除我对通知服务器客户端 IM 应用程序客户端的最佳方法的疑虑。问题:整个问题是如何通知客户端应用程序更新。我已经见过以下方法: 客户端不断检查更新:
python - 无法使用 im.getcolors
我正在尝试这段代码: im = Image.open("myimage") colors = im.getcolors() print colors 它返回“无”。所以我尝试了这个: im = Ima
c# - 打印网页未显示一些图像和一些背景颜色 im 网页
我为打印网页编写代码。我正在使用 javascript 打印网页，代码如下 function print() { window.print(); } 我在 Button 的 onclien
android - 从联系人获取 IM 属性
我正在为 android 编写一个 jabber messenger，我想查看潜在聊天伙伴的电话联系人列表；) 无法弄清楚如何获取联系人的特定属性。获取显示名称不是问题，问题在于获取 IM 用户名。
PHP mysql im 寻找好的格式和消除乱码
我有这个 php 代码，其中有很多 mysql_query 和 or die ( mysql_error() ) 我如何减少 mysql_query 或 or die ( mysql_error()
java - 无法从我的应用程序连接到 IMS apn
我需要从我的应用程序连接到 IMS apn。当我尝试连接到 IMS apn 时，它会在我的手机上连接和断开连接，即使在 kitkat 上使用彩信也会发生同样的情况。有人可以帮我解决这个问题吗？这是代码
php - 社交网站 IM/聊天系统的想法
我正在创建一个社交网络网站，我需要一个 IM/聊天解决方案。对话只是一对一的，用户只能与他们的 friend 聊天(即 Facebook 聊天 - 没有 channel ，没有房间......)。
android - 用于创建 IM 服务的编程语言？
我不是专业的程序员，我更多的是在业务方面，真的有一段时间没有编码了。问题是我正计划为手机开发一项新的 IM 服务，并且想知道在您看来，我应该在此过程中使用哪些最佳编程语言(聘请具有这些知识的人!)。
iphone - 在 IM 风格的应用程序中接收新消息的最佳方式
目前我只是每 3 秒查询一次服务器，看看是否有任何使用 NSURLRequest 等的新消息。如果有，它会将它们保存到数据库中，如果没有，则发送 NSNotificationCenter 通知，然后等
instant-messaging - 创建 IM 机器人
我正在尝试创建一个 IM 机器人，但我无法找到必要的资源。更新 Imified 存在一个问题，使 gtalk 机器人无法在线显示(并且没有响应)，它现在可以正常工作，所以我要关闭它。这个tutor
chat - 用于粘贴代码的良好 IM/Chat 解决方案
我们有几个分布式开发人员在几个项目上一起工作。我们一直在使用 Skype 与所有开发人员进行聊天，它工作正常，除了一件事: 它真的会破坏我们复制并粘贴到聊天中的任何代码——尤其是 Python 中的空
javascript - 使用 QuickBlox 进行文本聊天 (IM)
我是 QuickBlox 聊天新手.. 尝试使用 Javascript SDK。但这总是抛出 Uncaught ReferenceError: QB is not defined 不知道我错过了什么。
chat - 有没有办法访问 Skype IM 日志？
我尝试在 C:\Users[name]\AppData\Roaming\Skype 中查找，发现一个名为“chatsync”的文件夹，其中有一些神秘的文件夹，其中的文件以 .dat 结尾。我几乎可以肯
sms - IMS 上的 SMS 重要吗
2G 和 3G 已经在少数国家停用，其他国家也将很快停用。 LTE 模块的 VoLTE 功能对于能够通过 4G 进行调用而无需 2G/3G 回退是必需的。 native SMS 可以通过 2G/3G
python - 如何使用 cv2.im 显示大尺寸图像？
我正在尝试cv2.imshow我的图像进行透视变换。但是，我的图像很大，所以我看不到全貌: 如何解决这个问题？下面是我的代码: import cv2 import os import numpy

首页

博学

6Ren·AI

商城

python - ConvNet 中的 col2im 实现