gpt4 book ai didi

python - tf.reduce_sum(lastconv,axis=2)/tf.reduce_sum(tf.cast(tf.greater(lastconv, 0), tf.float32), axis=2) 用于代替均值池?

转载 作者:行者123 更新时间:2023-11-30 08:47:53 33 4
gpt4 key购买 nike

我正在处理眼睛轨迹数据和卷积神经网络。我被要求使用 tf.reduce_max(lastconv, axis=2)代替 MaxPooling 层和 tf.reduce_sum(lastconv,axis=2) / tf.reduce_sum(tf.cast(tf.greater(lastconv, 0), tf.float32), axis=2)代替 MeanPooling 层。

我有以下问题,但我无法弄清楚。如果你能让我理解那就太好了。

  1. reduce_max函数的内部计算和传统的MaxPool层相同吗?两者的输出在维度上是不同的,为什么会这样呢?我不太明白为什么?
  2. 为什么我们不能只使用 tf.reduce_mean MeanPooling 的函数,如tf.reduce_max用于MaxPooling?
  3. tf.reduce_sum(lastconv,axis=2) / tf.reduce_sum(tf.cast(tf.greater(lastconv, 0), tf.float32), axis=2)这如何作为 MeanPool 计算方式工作以及有何不同 tf.reduce_mean

我相信你可以看出我不明白什么reduce_max/min/mean/sum对输入张量做了什么,模型从这些函数中学到了什么?

关于数据:数据的形状是(24,4,15,2,87236),其中24个是受试者,4个温度变化和15个轨迹,2x87236是连续的眼睛注视(2因为x轴和y轴)轴)。我正在使用 LeaveOneOut CV,对 22 个科目进行训练,并分别对 1 个科目进行测试和验证。

创建训练集、验证集和测试集后,模型中的最终输入为 (22,60[4x15],2,87236) 、 (1,60,2,87236) 和 (1,60, 2,87236) 分别。

我希望我已经提供了有关我所处困境的足够信息,以便您帮助我解决问题。提前致谢。

最佳答案

reduce_max 取整个维度上的最大值,因此例如如果dim=1,则会减少

[[1,2,3],
[2,1,3],
[1,4,0]]

[3,3,4]
另一方面,最大池化着眼于某些移动窗口中的最大值,请参见例如 https://computersciencewiki.org/index.php/Max-pooling_/_Pooling 。这里的主要区别是窗口的形状。对于reduce_max,窗口是张量的整个切片,对于最大池化,它是某个指定的矩形。这也会导致不同的维度(要真正理解这一点,您可以看看如果在 reduce_max 中使用 keepdims=True 会发生什么)。

您对均值池层的替换似乎没有取算术平均值,而是除以正元素的数量(而不是一般的元素数量)。这可能就是您不能使用 reduce_mean 的原因。

关于python - tf.reduce_sum(lastconv,axis=2)/tf.reduce_sum(tf.cast(tf.greater(lastconv, 0), tf.float32), axis=2) 用于代替均值池?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59464570/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com