- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
为了学习 Keras LSTM 和 RNN,我想创建一个简单的问题来解决:给定一个正弦波,我们可以预测它的频率吗?
我不希望一个简单的神经网络能够预测频率,因为时间的概念在这里很重要。然而,即使使用 LSTM,我也无法学习频率;我能够学习一个平凡的零作为估计频率(即使对于火车样本)。
这是创建训练集的代码。
import numpy as np
import matplotlib.pyplot as plt
def create_sine(frequency):
return np.sin(frequency*np.linspace(0, 2*np.pi, 2000))
train_x = np.array([create_sine(x) for x in range(1, 300)])
train_y = list(range(1, 300))
现在,这是一个用于此示例的简单神经网络。
from keras.models import Model
from keras.layers import Dense, Input, LSTM
input_series = Input(shape=(2000,),name='Input')
dense_1 = Dense(100)(input_series)
pred = Dense(1, activation='relu')(dense_1)
model = Model(input_series, pred)
model.compile('adam','mean_absolute_error')
model.fit(train_x[:100], train_y[:100], epochs=100)
正如预期的那样,这个神经网络没有学到任何有用的东西。接下来,我尝试了一个简单的 LSTM 示例。
input_series = Input(shape=(2000,1),name='Input')
lstm = LSTM(100)(input_series)
pred = Dense(1, activation='relu')(lstm)
model = Model(input_series, pred)
model.compile('adam','mean_absolute_error')
model.fit(train_x[:100].reshape(100, 2000, 1), train_y[:100], epochs=100)
但是,这个基于 LSTM 的模型也没有学到任何有用的东西。
最佳答案
您认为训练 RNN 是一个简单的问题,但实际上您的网络设置并不容易:
如前所述,缺少重要样本。你把那么多数据丢进去(300 * 2000 点),但实际目标(频率)只被网络看到一次。即使网络确实学到了一些东西,它也很有可能会过度拟合。
数据不一致。请记住,RNN 擅长捕捉系列数据中的相似模式。例如,在 NLP 中,语料库中的所有句子都受相同的语言规则约束,更多的句子有助于 RNN 更好地理解这些规则,即,更多的数据有助于。
在您的情况下,具有不同频率的系列不太相似:将正弦与 frequency=1
和 frequency=100
进行比较。数据的这种多样性使学习变得更难,而不是更容易。这并不意味着 RNN 无法学习频率,它只是意味着您不应该对像您这样的微不足道的 RNN 很难学习感到惊讶。
数据规模。将频率从 1 更改为 300,将 x
和 y
的比例更改两个数量级,这对任何神经网络都可能存在问题。
由于您的目标很有教育意义,我通过将目标频率限制为 10 简单地解决了第二项和第三项,因此缩放和分布多样性不是什么大问题(欢迎您在这里尝试不同的值:您应该看到将这个参数增加到 50 会使任务复杂得多)。
第一项的解决方法是为 RNN 提供每个频率的 10 个示例,而不是一个。我还添加了一个隐藏层以增加网络灵 active ,以及一个简单的正则化器(Dropout
层)。
完整代码:
import numpy as np
from keras.models import Model
from keras.layers import Input, Dense, Dropout, LSTM
max_freq = 10
time_steps = 100
def create_sine(frequency, offset):
return np.sin(frequency * np.linspace(offset, 2 * np.pi + offset, time_steps))
train_y = list(range(1, max_freq)) * 10
train_x = np.array([create_sine(freq, np.random.uniform(0,1)) for freq in train_y])
train_y = np.array(train_y)
input_series = Input(shape=(time_steps, 1), name='Input')
lstm = LSTM(units=100)(input_series)
hidden = Dense(units=100, activation='relu')(lstm)
dropout = Dropout(rate=0.1)(hidden)
output = Dense(units=1, activation='relu')(dropout)
model = Model(input_series, output)
model.compile('adam', 'mean_squared_error')
model.fit(train_x.reshape(-1, time_steps, 1), train_y, epochs=200)
# Trying the network on the same data
test_x = train_x.reshape(-1, time_steps, 1)
test_y = train_y
predicted = model.predict(test_x).reshape([-1])
print()
print((predicted - train_y)[:12])
print(np.mean(np.abs(predicted - train_y)))
输出:
max_freq=10
[-0.05612183 -0.01982236 -0.03744316 -0.02568841 -0.11959982 -0.0770483
0.04643679 0.12057972 -0.00625324 -0.00724655 -0.16919005 -0.04512954]
0.0503574344847
max_freq=20(其他都一样)
[ 0.51365542 0.09269333 -0.009691 0.0619092 0.09852839 0.04378462
0.01430321 -0.01953268 0.00722599 0.02558327 -0.04520988 -0.0614748 ]
0.146024380232
max_freq=30(其他都一样)
[-0.28205156 -0.28922796 -0.00569081 -0.21314907 0.1068716 0.23497915
0.23975039 0.25955486 0.26333141 0.24235058 0.08320332 -0.03686047]
0.406703719805
请注意,结果是随机的,实际上增加 max_freq
会增加 divergence 的变化。但即使它收敛了,尽管有更多的数据,性能也没有提高,反而变得更糟,而且速度非常快。
关于python - 神经网络 : estimating sine wave frequency,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47932589/
我是一名优秀的程序员,十分优秀!