neural-network - GAN 的损失函数的理想值是多少-6ren

neural-network - GAN 的损失函数的理想值是多少

转载作者：行者123 更新时间：2023-12-03 16:24:57

32

4

最初由 IJ Goodfellow 提出的 GAN 使用以下损失函数，

D_loss = - log[D(X)] - log[1 - D(G(Z))]

G_loss = - log[D(G(Z))]

因此，鉴别器尝试最小化 D_loss，生成器尝试最小化 G_loss，其中 X 和 Z 分别是训练输入和噪声输入。 D(.) 和 G(.) 分别是鉴别器和生成器神经网络的映射。

正如原始论文所说，当 GAN 训练几个步骤时，它会达到一个生成器和判别器都无法改进的点，并且 D(Y) 到处都是 0.5，Y 是判别器的一些输入。在这种情况下，当 GAN 被充分训练到这一点时，

D_loss = - log(0.5) - log(1 - 0.5) = 0.693 + 0.693 = 1.386

G_loss = - log(0.5) = 0.693

那么，为什么我们不能使用 D_loss 和 G_loss 值作为评估 GAN 的指标呢？

如果两个损失函数偏离了这些理想值，那么 GAN 肯定需要训练好或架构需要设计好。正如原始论文中的定理 1 所讨论的，这些是 D_loss 和 G_loss 的最佳值，但为什么不能将它们用作评估指标？

最佳答案

我认为这个问题属于交叉验证，但无论如何:

我为此挣扎了很长一段时间，并想知道为什么没有问这个问题。
接下来是我目前所处的位置。不确定它是否会帮助你，但这是我的一些直觉。

G 和 D 损失是故障案例的良好指标...
当然，如果 G loss 是一个非常大的数字，而 D 为零，那么您的 GAN 不会发生任何好事。

...但不是很好的性能指标。
我训练了一堆 GAN，除了非常简单的例子外，几乎从未见过“0.5/0.5 案例”。大多数情况下，当输出 D(x) 和 D(G(z))(因此，损失)或多或少稳定时，您会感到高兴。所以不要把这些值当作“黄金标准”。
我缺少的一个关键直觉是 G 和 D 训练的同步。一开始，肯定 G 在生成东西方面确实很糟糕，但 D 在区分它们方面也很糟糕。随着时间的推移，G变得更好，但D也变得更好。所以经过多次 epoch，我们可以认为 D 真的很擅长辨别真假。因此，即使 G 只有 5% 的时间“愚弄”了 D(即 D(x)=0.95 和 D(G(z))=0.05)，那么这也可能意味着 G 实际上相当不错，因为它有时真的会愚弄很好的鉴别器。
如您所知，除了暂时查看图像质量之外，没有可靠的图像质量指标，但我发现对于我的用例，G 可以生成出色的图像，而仅在少数情况下愚弄 D。
这种同时训练的一个推论是训练开始时发生的事情:您可以让 D(X)=0.5 和 D(G(Z))=0.5，并且仍然让 G 产生几乎随机的图像:只是 D 是还不足以将它们与真实图像区分开来。

我看到你发布这个问题已经有几个月了。如果您在此期间获得了直觉，我会很高兴听到它!

关于neural-network - GAN 的损失函数的理想值是多少，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49420459/

32

4

0

文章推荐： tsql - DAX 等效于 T-SQL AVG OVER(PARTITION BY)

文章推荐： syntax - jq，何时使用点，何时不使用

文章推荐： sql - 重命名 Azure 数据仓库中的列

文章推荐： git - 打包文件在git中删除它

详解C语言sscanf()函数、vsscanf()函数、vscanf()函数
C语言sscanf()函数：从字符串中读取指定格式的数据头文件： ?
php - 如何解释at()函数； substr()函数;伪代码中的exist()函数
最近，我有一个关于工作预评估的问题，即使查询了每个功能的工作原理，我也不知道如何解决。这是一个伪代码。下面是一个名为foo()的函数，该函数将被传递一个值并返回一个值。如果将以下值传递给foo函数，
VBS教程：函数-CStr 函数
CStr 函数返回表达式，该表达式已被转换为 String 子类型的 Variant。 CStr(expression) expression 参数是任意有效的表达式。说明通常，可以
VBS教程：函数-CSng 函数
CSng 函数返回表达式，该表达式已被转换为 Single 子类型的 Variant。 CSng(expression) expression 参数是任意有效的表达式。说明通常，可
VBS教程：函数-CreateObject 函数
CreateObject 函数创建并返回对 Automation 对象的引用。 CreateObject(servername.typename [, location]) 参数 serv
VBS教程：函数-Cos 函数
Cos 函数返回某个角的余弦值。 Cos(number) number 参数可以是任何将某个角表示为弧度的有效数值表达式。说明 Cos 函数取某个角并返回直角三角形两边的比值。此比值是
VBS教程：函数-CLng 函数
CLng 函数返回表达式，此表达式已被转换为 Long 子类型的 Variant。 CLng(expression) expression 参数是任意有效的表达式。说明通常，您可以使
VBS教程：函数-CInt 函数
CInt 函数返回表达式，此表达式已被转换为 Integer 子类型的 Variant。 CInt(expression) expression 参数是任意有效的表达式。说明通常，可
VBS教程：函数-Chr 函数
Chr 函数返回与指定的 ANSI 字符代码相对应的字符。 Chr(charcode) charcode 参数是可以标识字符的数字。说明从 0 到 31 的数字表示标准的不可打印的
VBS教程：函数-CDbl 函数
CDbl 函数返回表达式，此表达式已被转换为 Double 子类型的 Variant。 CDbl(expression) expression 参数是任意有效的表达式。说明通常，您可
VBS教程：函数-CDate 函数
CDate 函数返回表达式，此表达式已被转换为 Date 子类型的 Variant。 CDate(date) date 参数是任意有效的日期表达式。说明 IsDate 函数用于判断 d
VBS教程：函数-CCur 函数
CCur 函数返回表达式，此表达式已被转换为 Currency 子类型的 Variant。 CCur(expression) expression 参数是任意有效的表达式。说明通常，
VBS教程：函数-CByte 函数
CByte 函数返回表达式，此表达式已被转换为 Byte 子类型的 Variant。 CByte(expression) expression 参数是任意有效的表达式。说明通常，可以
VBS教程：函数-CBool 函数
CBool 函数返回表达式，此表达式已转换为 Boolean 子类型的 Variant。 CBool(expression) expression 是任意有效的表达式。说明如果 ex
VBS教程：函数-Atn 函数
Atn 函数返回数值的反正切值。 Atn(number) number 参数可以是任意有效的数值表达式。说明 Atn 函数计算直角三角形两个边的比值 (number) 并返回对应角的弧
VBS教程：函数-Asc 函数
Asc 函数返回与字符串的第一个字母对应的 ANSI 字符代码。 Asc(string) string 参数是任意有效的字符串表达式。如果 string 参数未包含字符，则将发生运行时错误。
VBS教程：函数-Array 函数
Array 函数返回包含数组的 Variant。 Array(arglist) arglist 参数是赋给包含在 Variant 中的数组元素的值的列表（用逗号分隔）。如果没有指定此参数，则
VBS教程：函数-Abs 函数
Abs 函数返回数字的绝对值。 Abs(number) number 参数可以是任意有效的数值表达式。如果 number 包含 Null，则返回 Null；如果是未初始化变量，则返回 0。
VBS教程：函数-FormatPercent 函数
FormatPercent 函数返回表达式，此表达式已被格式化为尾随有 % 符号的百分比（乘以 100 ）。 FormatPercent(expression[,NumDigitsAfterD
VBS教程：函数-FormatNumber 函数
FormatNumber 函数返回表达式，此表达式已被格式化为数值。 FormatNumber( expression [,NumDigitsAfterDecimal [,Inc

首页

博学

6Ren·AI

商城

neural-network - GAN 的损失函数的理想值是多少