- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我很久以前就在 Java 中使用神经网络,现在我正在尝试学习在 Python 中使用 TFLearn 和 Keras。
我正在尝试构建一个自动编码器,但是当我遇到问题时,我向您展示的代码没有瓶颈特征(这应该会使问题变得更容易)。
在下面的代码中,我创建了网络、数据集(两个随机变量),并在训练后绘制了每个预测变量与其输入之间的相关性。
网络应该学习的是输出接收到的相同输入。
import matplotlib.pyplot as plt
import numpy as np
from keras.layers import Input, Dense
from keras.models import Model
from keras.models import load_model
from loaders.nslKddCup99.nslKddCup99Loader import NslKddCup99
def buildMyNetwork(inputs, bottleNeck):
inputLayer = Input(shape=(inputs,))
autoencoder = Dense(inputs*2, activation='relu')(inputLayer)
autoencoder = Dense(inputs*2, activation='relu')(autoencoder)
autoencoder = Dense(bottleNeck, activation='relu')(autoencoder)
autoencoder = Dense(inputs*2, activation='relu')(autoencoder)
autoencoder = Dense(inputs*2, activation='relu')(autoencoder)
autoencoder = Dense(inputs, activation='sigmoid')(autoencoder)
autoencoder = Model(input=inputLayer, output=autoencoder)
autoencoder.compile(optimizer='adadelta', loss='mean_squared_error')
return autoencoder
dataSize = 1000
variables = 2
data = np.zeros((dataSize,variables))
data[:, 0] = np.random.uniform(0, 0.8, size=dataSize)
data[:, 1] = np.random.uniform(0, 0.1, size=dataSize)
trainData, testData = data[:900], data[900:]
model = buildMyNetwork(variables,2)
model.fit(trainData, trainData, nb_epoch=2000)
predictions = model.predict(testData)
for x in range(variables):
plt.scatter(testData[:, x], predictions[:, x])
plt.show()
plt.close()
尽管有时结果是可以接受的,但很多其他情况下是 Not Acceptable ,我知道神经网络具有权重随机初始化,因此它可能会收敛到不同的解决方案,但我认为这太多了,我的想法可能有一些错误代码。
Sometimes correlation is acceptable
**
**
谢谢 Marcin Możejko!
确实这就是问题所在,我最初的问题是因为我试图构建一个自动编码器,所以为了与标题保持一致,这里提供了一个自动编码器示例(只是制作了一个更复杂的数据集并更改了激活函数):
import matplotlib.pyplot as plt
import numpy as np
from keras.layers import Input, Dense
from keras.models import Model
from keras.models import load_model
from loaders.nslKddCup99.nslKddCup99Loader import NslKddCup99
def buildMyNetwork(inputs, bottleNeck):
inputLayer = Input(shape=(inputs,))
autoencoder = Dense(inputs*2, activation='tanh')(inputLayer)
autoencoder = Dense(inputs*2, activation='tanh')(autoencoder)
autoencoder = Dense(bottleNeck, activation='tanh')(autoencoder)
autoencoder = Dense(inputs*2, activation='tanh')(autoencoder)
autoencoder = Dense(inputs*2, activation='tanh')(autoencoder)
autoencoder = Dense(inputs, activation='tanh')(autoencoder)
autoencoder = Model(input=inputLayer, output=autoencoder)
autoencoder.compile(optimizer='adadelta', loss='mean_squared_error')
return autoencoder
dataSize = 1000
variables = 6
data = np.zeros((dataSize,variables))
data[:, 0] = np.random.uniform(0, 0.5, size=dataSize)
data[:, 1] = np.random.uniform(0, 0.5, size=dataSize)
data[:, 2] = data[:, 0] + data[:, 1]
data[:, 3] = data[:, 0] * data[:, 1]
data[:, 4] = data[:, 0] / data[:, 1]
data[:, 5] = data[:, 0] ** data[:, 1]
trainData, testData = data[:900], data[900:]
model = buildMyNetwork(variables,2)
model.fit(trainData, trainData, nb_epoch=2000)
predictions = model.predict(testData)
for x in range(variables):
plt.scatter(testData[:, x], predictions[:, x])
plt.show()
plt.close()
对于这个例子,我使用了 TanH 激活函数,但我尝试了其他函数,效果也很好。数据集现在有 6 个变量,但自动编码器有 2 个神经元的瓶颈;只要变量 2 到 5 由变量 0 和 1 组合而成,自动编码器只需要传递这两个变量的信息并学习函数以在解码阶段生成其他变量。上面的例子展示了所有函数是如何学习的,除了一个,除法……我还不知道为什么。
最佳答案
我认为您的案例相对容易解释为什么您的网络可能无法学习身份函数。让我们看一下您的示例:
2d
空间 - 由于均匀分布,它不在 1d
或 0d
子流形上。从这里很容易看出,为了从您的自动编码器中获取身份函数,每个层都应该能够表示一个范围至少是二维的函数,因为最后一层的输出也应该位于 2d
流形上。 让我们检查一下您的网络并检查它是否满足条件需求:
inputLayer = Input(shape=(2,))
autoencoder = Dense(4, activation='relu')(inputLayer)
autoencoder = Dense(4, activation='relu')(autoencoder)
autoencoder = Dense(2, activation='relu')(autoencoder) # Possible problems here
您可能会看到瓶颈可能会导致问题 - 对于这一层,可能很难从第一点开始满足条件。对于这一层 - 为了获得二维输出范围,您需要具有权重,这将使所有示例不落入 relu
的饱和区域(在这种情况下,所有这些示例都将被压缩为0
在其中一个单元中 - 这使得范围不可能“完全”2d
)。所以基本上 - 这不会发生的可能性相对较小。也不能忽略反向传播不会将该单元移动到该区域的概率。
更新:
在评论中有人问为什么优化器无法防止或撤消饱和。这是一个重要的 relu
缺点的例子 - 一旦一个例子落入 relu
饱和区域 - 这个例子不会直接参与给定单元的学习.它可以通过影响之前的单位来影响它 - 但由于 0
派生 - 这种影响不是直接的。所以基本上不饱和示例来自副作用 - 而不是优化器的直接作用。
关于python - Keras 自动编码器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42514960/
我有课 class Header { @FCBTag(type="type1") --My custom annotation int a = "valueA"; @FCBTa
我一直在使用 Apache MINA 并正在学习 Netty。我过去使用过 MINA 累积编码器/解码器,我有兴趣看看 Netty 是否有类似的功能。我查看了 API,但没有看到任何内容。 最佳答案
我有一组使用 wsdl2java (Axis 1.4) 创建的类,我正在寻找一种方法来解码和编码来自/到字符串和对象的数据。我已经编写了一个 JAXB 解码器,它适用于我们的一些较新的内部对象,因为我
在我的自定义类 WLNetworkClient 中,我必须实现这样的方法: required init(coder aDecoder: NSCoder) { fatalError("init(
基于 transformer 的编码器-解码器模型是 表征学习 和 模型架构 这两个领域多年研究成果的结晶。本文简要介绍了神经编码器-解码器模型的历史,更多背景知识,建议读者阅读由 Seba
在使用 FFMPEG android java 库时发生以下异常的视频播放速度(使视频变慢)。 [aac @ 0x416c26f0] The encoder 'aac' is experimental
我正在从一个程序运行 ffmpeg,我们自己构建了 ffmpeg(我们没有使用包管理器或预构建的东西安装它)。 这是构建的命令: 2020-07-31 12:14:11.942 INFO ffmpeg
许多基于LSTM的seq2seq编码器-解码器架构教程(例如英法翻译),将模型定义如下: encoder_inputs = Input(shape=(None,)) en_x= Embedding(
如何覆盖使用 marshmallow 的 JSON 编码器库,以便它可以序列化 Decimal字段?我想我可以通过覆盖 json_module 来做到这一点在基地Schema或 Meta课,但我不知道
在我的 Grails 2.5.0 应用程序中,我使用了一组自定义 JSON 编码器来严格控制由我的 REST 端点返回的 JSON 格式。目前我在这样的服务中注册这些编码器 class Marshal
我需要多个自定义 JSON 编码器,因为我想针对不同的目的以不同的方式进行编码。我知道如何使用以下方法设置自定义编码器应用程序: JSON.registerObjectMarshaller(MyCla
查看文档,它是这样说的: https://netty.io/4.0/api/io/netty/channel/ChannelPipeline.html A user is supposed to ha
我希望为以下案例类提供 JSON 编码器: import io.circe.generic.extras.Configuration final case class Hello[T]( so
我正在构建一个 JPEG 图像编码器。就目前情况而言,为了对图像进行编码,用户输入他们希望编码的文件的名称以及由此创建的文件的名称。 我希望用户能够在命令行中设置编码的质量。我尝试重命名 new Jp
我有想要在 webview 中显示的 html 文本。 如specification ,数据必须经过 URI 转义。所以我尝试使用 URLEncoder.encode() 函数,但这对我没有帮助,因为
我目前正在自己实现 PNG 滤镜。我正在使用神经网络尝试创建比当前现有的 PNG 过滤器更好的预测: 0 - 无 1 - 子 2 - 向上 3 - 平均 4 - 派斯 5 - 我的实现(使用神经网
让我们假设我们有与 Schema 一致的 XML 和带有一些公共(public)字段的 Java 类: public clas
在我的 Java 应用程序中,我正在寻找 URLEncoder.encode(String s, String enc) 的流媒体版本.我想使用“application/x-www-form-urle
我确实有一个对象层次结构,我想使用“import javax.xml.bind.Marshaller”将其从 Java 对象转换为 xml。我的java类文件被编码在“Cp1252”中,我无法更改它。
使用 Netty 4.0.27 和 Java 1.8.0_20 所以我试图通过构建一个简单的聊天服务器(我猜是典型的网络教程程序?)来了解 Netty 的工作原理。设计我自己的简单协议(protoco
我是一名优秀的程序员,十分优秀!