machine-learning - 在多 channel 图像数据集上训练卷积网络-6ren

machine-learning - 在多 channel 图像数据集上训练卷积网络

转载作者：行者123 更新时间：2023-11-30 08:59:35

25

4

我正在尝试从头开始实现一个卷积神经网络，但我无法弄清楚如何对 RGB 等具有 3 维的多 channel 图像执行(矢量化)操作。关于遵循文章和教程，例如 this CS231n tutorial ，很清楚为单个输入实现一个网络，因为输入层将是一个 3d 矩阵，但数据集中总是有多个数据点。因此，我无法弄清楚如何实现这些网络以对整个数据集进行矢量化操作。

我已经实现了一个以 3d 矩阵作为输入的网络，但现在我意识到它不适用于整个数据集，但我必须一次传播一个输入。我真的不知道转换网络是否是是否对整个数据集进行矢量化。但如果是，我如何对多 channel 图像的卷积网络进行矢量化？

最佳答案

如果我答对了你的问题，你基本上是在问如何为小批量处理卷积层，这将是一个 4 维张量。

简单来说，您希望独立处理批处理中的每个输入并对每个输入应用卷积。无需使用循环进行矢量化即可进行编码，这相当简单。

矢量化实现通常基于 im2col technique ，它基本上将 4-D 输入张量转换为一个巨大的矩阵并执行矩阵乘法。下面是在 python 中使用 numpy.lib.stride_tricks 实现前向传递:

import numpy as np

def conv_forward(x, w, b, stride, pad):
  N, C, H, W = x.shape
  F, _, HH, WW = w.shape

  # Check dimensions
  assert (W + 2 * pad - WW) % stride == 0, 'width does not work'
  assert (H + 2 * pad - HH) % stride == 0, 'height does not work'

  # Pad the input
  p = pad
  x_padded = np.pad(x, ((0, 0), (0, 0), (p, p), (p, p)), mode='constant')

  # Figure out output dimensions
  H += 2 * pad
  W += 2 * pad
  out_h = (H - HH) / stride + 1
  out_w = (W - WW) / stride + 1

  # Perform an im2col operation by picking clever strides
  shape = (C, HH, WW, N, out_h, out_w)
  strides = (H * W, W, 1, C * H * W, stride * W, stride)
  strides = x.itemsize * np.array(strides)
  x_stride = np.lib.stride_tricks.as_strided(x_padded,
                                             shape=shape, strides=strides)
  x_cols = np.ascontiguousarray(x_stride)
  x_cols.shape = (C * HH * WW, N * out_h * out_w)

  # Now all our convolutions are a big matrix multiply
  res = w.reshape(F, -1).dot(x_cols) + b.reshape(-1, 1)

  # Reshape the output
  res.shape = (F, N, out_h, out_w)
  out = res.transpose(1, 0, 2, 3)
  out = np.ascontiguousarray(out)
  return out

请注意，它使用了线性代数库的一些重要功能，这些功能在 numpy 中实现，但可能不在您的库中。

顺便说一句，您通常不希望将整个数据集作为一批推送 - 将其分成几批。

关于machine-learning - 在多 channel 图像数据集上训练卷积网络，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45820735/

25

4

0

文章推荐： javascript - 做这个正则表达式替换的好方法

文章推荐： java - 如何在 Java 中循环访问 Clojure ISeq？

文章推荐： java - spring data couchbase 中的自定义方法

选择 channel <- <- channel
我很好奇为什么以下不起作用。一般select用default:防止死锁，但在这种情况下不是: package main import "fmt" func main () { a := mak
python - 在先 channel 和最后 channel 之间更改图像 channel 顺序的正确方法是什么？
我一生都无法弄清楚如何切换图像排序。图像以 (x,x,3) 格式读取，theano 要求它是 (3,x,x) 格式。我尝试更改顺序numpy.array([img[:,:,i] for i in ra
c - 如何向libnl发送单 channel 扫描请求，并接收相应 channel 的单 channel 扫描完成响应
我正在向 libnl 发送单个 SSID 和频率进行扫描，但我得到了多个扫描结果以及我请求的 SSID 和频率，但我需要单个扫描结果(仅适用于请求的 SSID)，如何实现这一点。请帮助我，我也发送了我
golang，goroutines，如何在另一个 channel 中设置 channel ，然后在关闭母 channel 后阅读
我是 Golang 的新手，但正在努力理解这门伟大的语言!请帮帮我.. 我有 2 个 channel 。 “进”和“出” channel in, out := make(chan Work),
转到 channel : consume data from channel although not push anything to channel
例如我有这段代码: package main import ( "fmt" ) func main() { c1 := make(chan interface{}) close
youtube-api - 如何获取经过身份验证的用户拥有的 YouTube channel 列表和关联的 channel URL(用户或 channel )
我们使用以下调用来获取经过身份验证的用户的 ChannelID，它适用于大多数情况。一些 YouTube 用户将他们的 channel 连接到 Google+ 信息页，但在这种情况下，我们的一位用户无
javascript - 统计文本 channel 、语音 channel 、所有 channel 和 Angular 色
case 'sinfo': const sinfo = new Discord.MessageEmbed() .addField('Server Name 🔎 :', message.guild.n
channel - 如何使用discord.py获取所有文本 channel ？
我需要让所有 channel 来创建一个 bunker 命令，这使得所有 channel 都是只读的。最佳答案他们变了Client.servers至 Client.guilds在 newer ve
去教程: Channels and Buffered Channels
为什么当第二个值通过另一个 go routine 发送并且没有收到发送的第一个值时， channel c 没有缓冲？ package main import "fmt" func sum(s []in
opencv - 是否有将 3 channel 垫拆分为三个 3 channel 垫而不是分成三个 1 channel 垫的内置函数？
据我所知，内置的 split 会将一个 3 channel Mat 拆分为三个 1 channel Mat。结果，这三个 Mat 只是具有一些不同强度的灰度。我的意图是获得三个 3 channel
windows - 我如何询问 Windows RAM 是在单 channel 、双 channel 还是四 channel 中运行？
如何检测当前的 RAM 配置？我需要询问 Windows RAM 当前是在单 channel 、双 channel 还是四 channel 中运行。我搜索了很多，并没有在这个网站或其他网站上找到任何
audio - gstreamer 将多 channel wav 文件拆分为单独的 channel 并将每个 channel 编码为 mp3、alac 等并保存到文件
我需要拆分一个多 channel wav 文件并将每个 channel 编码为 mp3 文件。我知道 gtresamer 的 deinterleave 插件，但我不确定如何将它用于 wav 文件以及
android - Android Studio Beta Channel、Android Studio Canary Channel、Android Studio Dev Channel 有什么区别？
关闭。这个问题需要details or clarity .它目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 关闭 8 年前。 Improve
hyperledger-fabric - "channel [{channel-name}]: MSP error: channel doesn' t exist”警告无法在 Hyperledger Fabric 上实例化链代码
我正在尝试运行 Hyperledger Fabric 网络，它由单个订购者、单个对等节点和一个 cli 组成。为了学习启动 Hyperledger Fabric 网络的过程，从创建与加密相关的工件到将
拉拉维尔。每个用户的多个 channel 或个人 channel ？
我在 Laravel 中使用事件广播。我正在使用基于角色的通知访问权限。我有用于广播的自定义 auth guard。当用户连接到 channel 时，客户端将具有内部权限的 access_token
sockets - Phoenix Channels - 每个插槽有多个 channel
我正在编写一个使用 Elixir Channels 来处理实时事件的应用程序。我知道每个客户端将打开 1 个套接字，并且可以在其上多路复用多个 channel 。所以我的应用程序是一个聊天应用程序，其
ffmpeg - 使用ffmpeg将两个 channel 转换为左或右的单个 channel
我有一些 .wav 文件，我想转换它们的频率 (fs) 和 channel 数 (nchannels)。我在jupyter笔记本python3.6上使用ffmpeg。我使用了以下命令并且它有效。 cm
ffmpeg - 将PNG序列的Alpha channel 转换为H265的Y channel
我有一个视频渲染器，它需要两个 H265 流(YUV420)，我需要烘焙它们以使它们中的一个与另一个形成 alpha 蒙版。这一切都已解决并且效果很好，但是如果我按照此处的说明进行操作: ffmpeg
ffmpeg 从具有多个 channel 的输入中输出单独的 channel
我运行此命令以便能够将 udp 直播流传输到可使用正在构建的移动应用程序播放的 http 直播流。它只是一个只有音频流的流。 ffmpeg -i udp://@localhost:1111 -map
javascript - 在与原始 channel 相同的位置制作克隆 channel
我在我的 discord.js 机器人中创建了 nuke 命令，它创建了具有相同名称、权限、主题等的 channel ，并删除了“原始” channel 。但是有一个问题，如何使 channel 与“

首页

博学

6Ren·AI

商城

machine-learning - 在多 channel 图像数据集上训练卷积网络