python - tensorflow 损失已经很低-6ren

python - tensorflow 损失已经很低

转载作者：太空宇宙更新时间：2023-11-03 14:20:33

我正在做一个带有强化学习的人工智能，我得到了奇怪的结果，损失显示如下: tensorflow 损失:/image/hispR.jpg

在训练时，每场比赛结束后，它都会与随机玩家和具有加权矩阵的玩家进行比赛，但它会上下波动:结果:/image/mtWiS.jpg

基本上我正在做一个学习玩黑白棋的强化学习代理。使用 E-greedy、体验回放和使用 Keras over Tensorflow 的深度网络。尝试了不同的架构，例如 sigmoid、relu 以及上图所示的 tanh。他们都有类似的损失，但结果有点不同。在这个例子中，智能体正在从 10 万场职业比赛中学习。这是架构，默认学习率为 0.005:

model.add(Dense(units=200,activation='tanh',input_shape=(64,)))
model.add(Dense(units=150,activation='tanh'))
model.add(Dense(units=100,activation='tanh'))
model.add(Dense(units=64,activation='tanh'))
optimizer = Adam(lr=lr, beta_1=0.9, beta_2=0.999, epsilon=1e-08, decay=0.0)
model.compile(loss=LOSS,optimizer=optimizer)

原码:https://github.com/JordiMD92/thellia/tree/keras

那么，为什么我会得到这些结果？现在我的输入是 64 个神经元(8*8 矩阵)，其中有 0 个空白方 block 、1 个黑色方 block 和 -1 个白色方 block 。使用负输入有什么不好吗？

最佳答案

这可能是你的激活函数的问题。尝试使用 relu 而不是 tanh，如果您使用深度 q 学习，您可能不需要任何激活函数或关心重置权重的优化器。

关于python - tensorflow 损失已经很低，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47976845/

文章推荐： python - peewee 中的动态字段查询

文章推荐： Python Decimal to string 产生奇怪的科学记数法

文章推荐： php - 如何在我的站点 ssl 上制作表单

即使#threads, requests/sec 很低，asp.net 请求也会排队
我们有一个运行在具有 12 GB 内存和 16 个内核的 iis 7.5 x64 (w2k8) 上的 asp.net 4.0(集成模式)Web 应用程序，该应用程序存在排队请求峰值的问题。通常队列为零
xcode - 为什么我的应用程序(游戏)的 fps(30) 很低？ (xcode Sprite swift )
view.showFPS = true --> 显示我的游戏有 30 fps。它非常慢，我的游戏需要更高的 fps(每秒帧数)。为什么我的游戏帧率很低，我怎样才能提高它？我注释掉了大部分代码，它的帧

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - tensorflow 损失已经很低