- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
仅供引用:我上传了您自己测试所需的所有内容(数据 + 简化的脚本)。
这是我的问题:我试图训练一个使用四个输入值的非常简单的模型x(0), x(1), x(2), x(3)预测值 x(4),即 y = x(4)。
但是,我修改了数据,使得 y = x(4) 是一个完美的线性外推:y = x(3) + (x(3)-x(2))
我使用的模型是一个具有四个神经元的致密层。权重“0 0 -1 2”将是一个完美的解决方案(丢失“0”)。
但是,我无法让它达到这些值。
你能帮忙或告诉我,为什么吗?
文件在这里:https://ufile.io/5d2t4
import numpy as np
import matplotlib.pyplot as plt
from keras.models import Sequential
from keras.layers import Flatten, Dense
from keras.optimizers import Adadelta, Adam
import keras.backend as K
def root_mean_squared_error(y_true, y_pred):
return K.sqrt( K.mean( K.square( y_pred - y_true ) ) )
X_train = np.random.random(240000*4)
X_train = np.reshape( X_train, ( 240000, 1, 4 ) )
# predict the gradient of the
y_train = X_train[:,0,3] - X_train[:,0,2]
inputShape = ( X_train.shape[1], X_train.shape[2] )
# create model
model = Sequential()
model.add( Flatten( input_shape=inputShape ) )
model.add( Dense( 1 ) )
model.compile( loss=root_mean_squared_error, optimizer=Adam( decay = 0.1 ) )
# train model
batchSize = 8
model.fit( X_train, y_train, nb_epoch=10, batch_size=batchSize, shuffle=True )
y_train_predicted = model.predict( X_train)
y_train_predicted = np.asarray(y_train_predicted).ravel()
y_train_predicted_rmse = np.sqrt( np.mean( np.square( y_train_predicted - y_train ) ) )
print( "y_train RMSE = " + str( y_train_predicted_rmse ) )
最佳答案
当我的“明显”模型不收敛时,我首先问自己的是超参数是否合适。
我调整了您的代码以修复学习率。我删除了衰减并添加了 0.01 的学习率而不是默认的 0.001(参见 https://keras.io/optimizers/)。一个epoch后的权重为
[ 9.3402149e-04],
[ 5.8139337e-04],
[-9.9929601e-01],
[ 1.0009530e+00]
这大约是我们在代码中设置的。
[0, 0, -1, 1]
如果您只是保持默认学习率 (0.001) 没有衰减,它也可以正常工作。在下面找到工作代码。
import numpy as np
import matplotlib.pyplot as plt
from keras.models import Sequential
from keras.layers import Flatten, Dense
from keras.optimizers import Adadelta, Adam
import keras.backend as K
def root_mean_squared_error(y_true, y_pred):
return K.sqrt( K.mean( K.square( y_pred - y_true ) ) )
X_train = np.random.random(240000*4)
X_train = np.reshape( X_train, ( 240000, 1, 4 ) )
y_train = X_train[:,0,3] - X_train[:,0,2]
inputShape = ( X_train.shape[1], X_train.shape[2] )
# create model
model = Sequential()
model.add( Flatten( input_shape=inputShape ) )
model.add( Dense( 1 ) )
model.compile( loss=root_mean_squared_error, optimizer=Adam( lr=0.01 ) )
# train model
batchSize = 8
model.fit( X_train, y_train, nb_epoch=1, batch_size=batchSize, shuffle=True )
y_train_predicted = model.predict( X_train)
y_train_predicted = np.asarray(y_train_predicted).ravel()
y_train_predicted_rmse = np.sqrt( np.mean( np.square( y_train_predicted - y_train ) ) )
print( "y_train RMSE = " + str( y_train_predicted_rmse ) )
x = [model.layers]
x[0][1].get_weights()
关于python - 神经网络在简单的线性插值任务中表现不佳,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49088752/
我正在用 C++ 开发一个程序,我必须实现一个 cron。由于不同的原因,这个 cron 应该每小时和每 24 小时执行一次。我的第一个想法是创建一个独立的 pthread 并在每次 1h 内休眠。这
我需要向同一场景几何添加多个体素(立方体等于),但每个体素具有不同的纹理。 我的体素超过 500 个,导致性能出现严重错误。 这是我的代码: texture = crearTextura(voxel.
对于 MySQL 数据库,我有 2 个场景,我不确定该选择哪一个,并且对于一些表我也遇到了同样的困境。 我正在制作一个仅供成员(member)访问的网络应用程序。每个成员都有自己的交易、费用和“列表”
我想知道一个简单的事情: 当设置一个被所有 child 继承的样式时,是否建议最具体? Structure: html > body > parent_content > wrapper > p 我想
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
这些天我正在阅读有关 JPA 的内容。我了解到可以在 JPQL 中使用 explicit 或 implicit JOIN。 显式加入 em.createQuery(“SELECT b.title, p
我有一种情况需要连接几个字符串以形成一个类的 id。基本上,我只是在列表中循环以获取对象的 ToString 值,然后将它们连接起来。 foreach (MyObject o in myList)
我正在检查我的游戏在拖尾效果下的性能会降低多少。但我注意到每秒的操作次数更多了。这怎么可能? 这是怎么回事... context.fillRect(0, 0, 500, 500); // cl
如果我可以选择使用全局变量或传递变量,哪个选项在速度和内存使用方面更好? // global variable function func(){ global $var; echo $var;
我有一个类似这样的表“tbl”:ID bigint(20) - 主键,自增字段1字段2字段3 该表有 60 万多行。 查询:SELECT * from tbl ORDER by ID LIMIT 60
谁能告诉我,我如何比较 TSP 最优和启发式算法?我已经实现了 TSP,但不知道如何比较它们。事实上,我怎样才能找到 TSP 的最优成本?有什么方法或猜测吗? 谢谢 最佳答案 用众所周知的基准实例检查
我有一个 NSTextStorage里面有长文本(比如一本书有 500 页,当前字体在设备上超过 9000 页)。我以这种方式为 textcontainer 分发此文本: let textStorag
我有一个根据邮政编码搜索项目的应用程序。 在搜索邮政编码时,我返回了来自该城市/社区的所有产品(通过解析邮政编码完成)。 我现在需要根据与原始邮政编码的距离对这些产品进行分类。 我将纬度/经度存储在数
我有许多进程(大约100到1000个进程),每个进程都必须向其他进程(例如大约10个)发送一些数据。 (通常,但不一定总是这样,如果A发送给B,B也发送给A。)每个进程都知道必须从哪个进程接收多少数据
我知道无状态组件使用起来更舒服(在特定场景下),但是既然你不能使用shouldComponentUpdate,这是否意味着组件将在每次props更改时重新渲染?我的问题是,使用带有智能 shouldC
我正在研究 Google Pagespeed 的加速页面加载时间指南列表。其中之一是缩小 CSS 和 JS 文件。 由于这些文件经常更改,我正在考虑使用 PHP 脚本根据请求(来自浏览器)即时缩小此脚
我正在尝试从下表构建 SQL 查询(示例): Example of table with name "performances" 这是带有运动表现的表格。我想从这个表中选择每个学科和一组一个或多个类别
假设我们有一个字符串 var "sA",我想检查字符串 "123"是否在 sA 的末尾。 什么更好,为什么: if(sA.length() > 2) sA.substr(sA.length()-3)
关于受这篇文章启发的可参数化查询 LINQ group by property as a parameter我获得了一个很好的参数化查询,但在性能上有一个缺点。 public static void
| 和| 之间有什么主要区别吗?和 + 从长远来看会影响代码的性能吗?或者都是 O(1)?我正在使用的代码是这样的: uint64_t dostuff(uint64_t a,uint64_t b){
我是一名优秀的程序员,十分优秀!