python - 对于变分自动编码器，重建损失应该计算为图像的总和还是平均值？-6ren

python - 对于变分自动编码器，重建损失应该计算为图像的总和还是平均值？

转载作者：行者123 更新时间：2023-12-05 03:50:02

25

4

我正在学习这个变分自动编码器教程:https://keras.io/examples/generative/vae/ .

我知道VAE的损失函数包括对比原图和重建的重建损失，以及KL损失。但是，我对重建损失以及它是在整个图像(平方差和)还是每个像素(平均平方差和)上感到有点困惑。我的理解是重建损失应该是每像素 (MSE)，但我遵循的示例代码将 MSE 乘以 28 x 28，即 MNIST 图像尺寸。那是对的吗？此外，我的假设是这会使重建损失项显着大于 KL 损失，我不确定我们是否想要这样。

我尝试删除乘以 (28x28) 的乘法，但这导致重建效果极差。无论输入如何，基本上所有的重建看起来都是一样的。我可以使用 lambda 参数来捕获 kl 散度和重建之间的权衡，还是不正确，因为损失具有精确的推导(而不是仅仅添加正则化惩罚)。

reconstruction_loss = tf.reduce_mean(
    keras.losses.binary_crossentropy(data, reconstruction)
)
reconstruction_loss *= 28 * 28
kl_loss = 1 + z_log_var - tf.square(z_mean) - tf.exp(z_log_var)
kl_loss = tf.reduce_mean(kl_loss)
kl_loss *= -0.5
total_loss = reconstruction_loss + kl_loss

最佳答案

例子

我熟悉那个例子，我认为 28x28 乘数是合理的，因为操作 tf.reduce_mean(kl_loss) 取所有的平均损失图像中的像素将产生 0 到 1 之间的数字，然后将其乘以像素数。这是 another take带有用于创建 VAE 的外部训练循环。

问题是后塌陷

以上不会成为问题，因为它只是乘以一个常数，如果不是因为您指出的 KL 散度 项。 KL 损失作为一个正则化器来惩罚潜在变量概率分布，当使用高斯组合进行采样时，该概率分布与编码器创建的样本不同。自然而然，问题来了，reconstruction loss应该多少，penalty应该多少。这是一个研究领域。考虑 β-VAE，据称它通过增加 KL 损失的重要性来解开表征，另一方面，增加 β 太多，你会得到一种称为后验的现象崩溃Re-balancing Variational Autoencoder Loss for Molecule Sequence Generation将 β 限制为 0.1 以避免该问题。但它甚至可能不像 The Usual Suspects? Reassessing Blame for VAE Posterior Collapse 中解释的那么简单. Diagnosing and Enhancing VAE Models中提出了一个彻底的解决方案.同时Balancing reconstruction error and Kullback-Leibler divergence in Variational Autoencoders建议有一种更简单的确定性(更好)的方法。

实验和扩展

对于像 Minst 这样简单的东西，尤其是那个例子，尝试试验。保留 28x28 项，并将 kl_loss 任意乘以常数 B，其中 0 <= B < 28*28。在训练过程中跟踪kl损失项和重建损失项，并将其与第一个引用图进行比较。

关于python - 对于变分自动编码器，重建损失应该计算为图像的总和还是平均值？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63679934/

25

4

0

文章推荐： r - 如何从 Rmarkdown 文档中的帮助功能显示输出

文章推荐： JMeter 为每次迭代生成相同的随机数

Java 编码器。使用标签值作为属性值
我有课 class Header { @FCBTag(type="type1") --My custom annotation int a = "valueA"; @FCBTa
java - 累积解码器/编码器
我一直在使用 Apache MINA 并正在学习 Netty。我过去使用过 MINA 累积编码器/解码器，我有兴趣看看 Netty 是否有类似的功能。我查看了 API，但没有看到任何内容。最佳答案
java - Axis 编码器
我有一组使用 wsdl2java (Axis 1.4) 创建的类，我正在寻找一种方法来解码和编码来自/到字符串和对象的数据。我已经编写了一个 JAXB 解码器，它适用于我们的一些较新的内部对象，因为我
swift - 如何测试所需的初始化(编码器 :)?
在我的自定义类 WLNetworkClient 中，我必须实现这样的方法: required init(coder aDecoder: NSCoder) { fatalError("init(
编码器|基于Transformers的编码器-解码器模型
基于 transformer 的编码器-解码器模型是表征学习和模型架构这两个领域多年研究成果的结晶。本文简要介绍了神经编码器-解码器模型的历史，更多背景知识，建议读者阅读由 Seba
android - 编码器 'aac' 在处理视频以减慢速度时未启用异常
在使用 FFMPEG android java 库时发生以下异常的视频播放速度(使视频变慢)。 [aac @ 0x416c26f0] The encoder 'aac' is experimental
FFMPEG 找不到 H264 编码器
我正在从一个程序运行 ffmpeg，我们自己构建了 ffmpeg(我们没有使用包管理器或预构建的东西安装它)。这是构建的命令: 2020-07-31 12:14:11.942 INFO ffmpeg
keras - LSTM 编码器-解码器推理模型
许多基于LSTM的seq2seq编码器-解码器架构教程(例如英法翻译)，将模型定义如下: encoder_inputs = Input(shape=(None,)) en_x= Embedding(
python - 如何在棉花糖中设置 JSON 编码器？
如何覆盖使用 marshmallow 的 JSON 编码器库，以便它可以序列化 Decimal字段？我想我可以通过覆盖 json_module 来做到这一点在基地Schema或 Meta课，但我不知道
json - 注册自定义 JSON 编码器
在我的 Grails 2.5.0 应用程序中，我使用了一组自定义 JSON 编码器来严格控制由我的 REST 端点返回的 JSON 格式。目前我在这样的服务中注册这些编码器 class Marshal
json - 如何为一个类设置多个自定义 JSON 编码器
我需要多个自定义 JSON 编码器，因为我想针对不同的目的以不同的方式进行编码。我知道如何使用以下方法设置自定义编码器应用程序: JSON.registerObjectMarshaller(MyCla
java - Netty中的解码器、编码器、ServerHandler管道
查看文档，它是这样说的: https://netty.io/4.0/api/io/netty/channel/ChannelPipeline.html A user is supposed to ha
json - 具有默认参数的通用案例类的 Circe 编码器
我希望为以下案例类提供 JSON 编码器: import io.circe.generic.extras.Configuration final case class Hello[T]( so
java - JPEG 编码器 - 从命令行设置质量
我正在构建一个 JPEG 图像编码器。就目前情况而言，为了对图像进行编码，用户输入他们希望编码的文件的名称以及由此创建的文件的名称。我希望用户能够在命令行中设置编码的质量。我尝试重命名 new Jp
java - Android:HTML 编码器
我有想要在 webview 中显示的 html 文本。如specification ，数据必须经过 URI 转义。所以我尝试使用 URLEncoder.encode() 函数，但这对我没有帮助，因为
java - PNG 编码器 - 添加自己的过滤器实现
我目前正在自己实现 PNG 滤镜。我正在使用神经网络尝试创建比当前现有的 PNG 过滤器更好的预测: 0 - 无 1 - 子 2 - 向上 3 - 平均 4 - 派斯 5 - 我的实现(使用神经网
java - 两种不同的模式和 JAXB 编码器
让我们假设我们有与 Schema 一致的 XML 和带有一些公共(public)字段的 Java 类: public clas
java - 流式 URL 编码器
在我的 Java 应用程序中，我正在寻找 URLEncoder.encode(String s, String enc) 的流媒体版本.我想使用“application/x-www-form-urle
Java 编码器 "input encoding"
我确实有一个对象层次结构，我想使用“import javax.xml.bind.Marshaller”将其从 Java 对象转换为 xml。我的java类文件被编码在“Cp1252”中，我无法更改它。
java - 未调用 Netty 编码器
使用 Netty 4.0.27 和 Java 1.8.0_20 所以我试图通过构建一个简单的聊天服务器(我猜是典型的网络教程程序？)来了解 Netty 的工作原理。设计我自己的简单协议(protoco

首页

博学

6Ren·AI

商城