- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我只使用Dense
层编写了一个普通的自动编码器。下面是我的代码:
iLayer = Input ((784,))
layer1 = Dense(128, activation='relu' ) (iLayer)
layer2 = Dense(64, activation='relu') (layer1)
layer3 = Dense(28, activation ='relu') (layer2)
layer4 = Dense(64, activation='relu') (layer3)
layer5 = Dense(128, activation='relu' ) (layer4)
layer6 = Dense(784, activation='softmax' ) (layer5)
model = Model (iLayer, layer6)
model.compile(loss='binary_crossentropy', optimizer='adam')
(trainX, trainY), (testX, testY) = mnist.load_data()
print ("shape of the trainX", trainX.shape)
trainX = trainX.reshape(trainX.shape[0], trainX.shape[1]* trainX.shape[2])
print ("shape of the trainX", trainX.shape)
model.fit (trainX, trainX, epochs=5, batch_size=100)
1) softmax
提供概率分布。明白了。这意味着,我将拥有一个由 784 个值组成的向量,概率在 0 到 1 之间。例如 [ 0.02, 0.03..... 最多 784 个项目],将所有 784 个元素相加得到 1。
2)我不明白二元交叉熵如何处理这些值。二元交叉熵适用于两个输出值,对吗?
最佳答案
在自动编码器的上下文中,模型的输入和输出是相同的。因此,如果输入值在 [0,1] 范围内,则可以使用 sigmoid 作为最后一层的激活函数。否则,您需要为最后一层使用适当的激活函数(例如默认的线性激活函数)。
对于损失函数,它再次回到输入数据的值。如果输入数据仅在零和一之间(而不是它们之间的值),则binary_crossentropy
可以作为损失函数。否则,您需要使用其他损失函数,例如'mse'
(即均方误差)或'mae'
(即平均绝对误差)。请注意,如果输入值在 [0,1]
范围内,您可以使用通常使用的 binary_crossentropy
(例如 Keras autoencoder tutorial 和 this paper )。但是,不要期望损失值会变为零,因为当预测和标签不为零或不为一(无论它们是否相等)时,binary_crossentropy
不会返回零。 Here是来自Hugo Larochelle的视频他解释了自动编码器中使用的损失函数(关于使用 binary_crossentropy
以及 [0,1] 范围内的输入的部分从 5:30 开始)
具体来说,在您的示例中,您使用的是 MNIST 数据集。因此,默认情况下 MNIST 的值是 [0, 255] 范围内的整数。通常您需要首先对它们进行标准化:
trainX = trainX.astype('float32')
trainX /= 255.
现在值将在 [0,1] 范围内。因此,sigmoid
可以用作激活函数,binary_crossentropy
或 mse
可以用作损失函数。
为什么即使真实标签值(即真实值)在 [0,1] 范围内也可以使用 binary_crossentropy
?
请注意,我们正在尝试最小化训练中的损失函数。因此,如果当预测等于真实标签时,我们使用的损失函数达到最小值(可能不一定等于零),那么它是一个可接受的选择。让我们验证一下 binray 交叉熵的情况,其定义如下:
bce_loss = -y*log(p) - (1-y)*log(1-p)
其中y
是真实标签,p
是预测值。让我们将 y 视为固定的,看看 p 的值最小化此函数:我们需要对 p 求导(我假设log
是自然对数函数,以简化计算):
bce_loss_derivative = -y*(1/p) - (1-y)*(-1/(1-p)) = 0 =>
-y/p + (1-y)/(1-p) = 0 =>
-y*(1-p) + (1-y)*p = 0 =>
-y + y*p + p - y*p = 0 =>
p - y = 0 => y = p
正如您所看到的,当y=p
时,即当真实标签等于预测标签时,二元交叉熵具有最小值,这正是我们正在寻找的。
关于machine-learning - 二进制交叉熵损失在自动编码器上如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52441877/
我想做的是,如果鼠标位于“下一个”按钮上,它会以慢速向右滚动,如果鼠标没有位于“下一个”按钮上,它会停止滚动? 这是我的尝试http://jsfiddle.net/mdanz/nCCRy/14/ $(
StyleCop 是一个很棒的视觉工作室小插件。但它不会向您显示实时提示或提供任何自动修复。 随之而来的是 reSharper 和 StyleCop for reSharper,这是理想的解决方案,但
我为我的MatchQuery使用了模糊性选项,但是我想将模糊性值设置为auto。有什么办法吗? 另外,对于完成建议程序,您可以将其设置为支持unicode,对于我的MatchQuery,有什么方法可以
我想从表中获取一行[字符串名称,字符串密码,int 某些内容]并将其映射到一个 User 对象,该对象具有 3 个属性,如上面的 getter 和 setter有什么方法可以自动完成吗?我考虑过反射,
我有一个像这样的方法:void m1(string str) 并且有一个像这样的类: public class MyClass { public bool b1 { set; get; }
我正在尝试使用 $rootScope 从一个 Controller 向另一个 Controller $broadcast 一些数据。 如果我使用像 ng-click 这样的触发器来运行将广播的功能,它
我考虑了很多关于是要使用完全自动化的缓存还是手动缓存。 我们的自动方法是一种解决方案,它可以挖掘数据库、查询和格式化每个潜在和 future 的数据请求,并将其保存到适当的缓存存储(内存缓存或基于磁盘
我的 CSS 必须使用过渡来更改,直到现在我都使用 div:hover 来实现。 当您单击另一个 div 时需要激活过渡,而不是当您将鼠标悬停在必须移动/更改的 div 上时。 我该怎么做? 谢谢 永
在我的应用程序中,我需要一些动画,但如果它已经设置了动画,则不需要持续时间。但我的问题是它会自动添加持续时间。 在这里你可以看到 2 个函数,第二个没有持续时间但它确实有持续时间(可能从 1 秒开始)
两年前,我需要制作一个工具,通过 POST 自动将 txt/csv 文件上传到我的 Web 服务器,然后使用 cronjob 通过 PHP 对其进行解析。 这有两次在每天午夜自动发生。尽管这行得通,但
请阅读下面程序中的评论: #include void test(char c[]) { c=c+2; //why does this work ? c--; printf("%
也许是个幼稚的问题,但是...... 确认或拒绝: 自动和静态存储持续时间的对象/变量的内存的存在是在编译时确定的,程序运行时失败的可能性绝对为零,因为没有足够的内存用于自动对象。 自然地,当自动对象
有没有什么方法可以自动获得类中属性更改的通知,而不必在每个 setter 中都编写 OnPropertyChanged? (我有数百个属性,我想知道它们是否已更改)。 安东建议 dynamic pro
我们在使用 Azure DevOps 的项目中采用了 gitflow 流程。我有以下场景: 当功能分支合并到 Develop 时,我想在完成拉取请求的同时执行压缩合并策略 当 Release 分支定期
我的网站上有一个评论部分,我将 html 编码的评论保存在我的数据库中。所以我添加了这条评论- "testing" `quotes` \and backslashes\ and html 并将其保存在
是否存在“ checkin 前 TFS 自动 checkout ”这样的功能,以便在我说“ checkin ”之前我不会 checkout 任何文件,例如以防我只是临时更改文件 - 这一直发生。 换句
我有一个运行在 Linux/Apache/Tomcat 堆栈上的网站,它需要每隔几个月自动脱机以进行服务器维护,这将持续任意时间。有哪些选项可以让 Apache 建立和取消“服务器维护”页面? 我需要
我经常在工作中创建文档,在公司内部,由于我们使用的首字母缩写词和缩写词的数量,我们几乎拥有自己的语言。因此,我厌倦了在发布文档之前手动创建首字母缩写词和缩写表,并且快速的谷歌搜索发现了一个可以有效地为
我希望在用户或宏将计算模式从自动更改为手动或手动更改为自动时运行代码。是否有为此触发的事件? (属性是 Application.Calculation 在 Excel 互操作中。) 使用 Excel
这个问题在这里已经有了答案: Repeat command automatically in Linux (13 个回答) 6年前关闭。 我想创建一个脚本来获取另一个文件夹中的所有文件夹名称。并为这些
我是一名优秀的程序员,十分优秀!