gpt4 book ai didi

python - Keras MLP 分类器不学习

转载 作者:行者123 更新时间:2023-11-28 16:58:00 24 4
gpt4 key购买 nike

我有这样的数据 enter image description here

enter image description here

有 29 列,我必须预测其中的 winPlacePerc(数据帧的最末端)在 1 之间(高百分比)到 0(低百分比)

29 列中,25数字 数据 3 是 ID(对象) 1 是 分类

我删除了所有 Id 列(因为它们都是唯一的)并将分类(匹配类型)数据编码为一个热编码

完成所有这些后,我剩下 41 列(一个热后)

after one hot encoded

这就是我创建数据的方式

X = df.drop(columns=['winPlacePerc'])
#creating a dataframe with only the target column
y = df[['winPlacePerc']]

现在我的 X 有 40 列,这是我的标签数据

> y.head()

winPlacePerc
0 0.4444
1 0.6400
2 0.7755
3 0.1667
4 0.1875

我也碰巧有非常大量的数据,比如 400k 数据,所以出于测试目的,我正在训练其中的一小部分,使用 sckit 进行训练

X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.997, random_state=32)

它提供了将近 13k 的训练数据

对于模型,我使用的是 Keras 顺序模型

from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dense, Dropout, Activation
from keras.layers.normalization import BatchNormalization
from keras import optimizers

n_cols = X_train.shape[1]

model = Sequential()

model.add(Dense(40, activation='relu', input_shape=(n_cols,)))
model.add(Dense(1, activation='sigmoid'))

model.compile(loss='mean_squared_error',
optimizer='Adam',
metrics=['accuracy'])

model.fit(X_train, y_train,
epochs=50,
validation_split=0.2,
batch_size=20)

由于我的 y 标签数据介于 0 和 1 之间,我使用 sigmoid 层作为我的输出层

这是训练和验证损失和准确性图

enter image description here enter image description here

我还尝试使用step 函数和binary cross entropy 损失函数将标签转换为binary

之后 y-label 数据看起来像

> y.head()

winPlacePerc
0 0
1 1
2 1
3 0
4 0

和改变损失函数

model.compile(loss='binary_crossentropy',
optimizer='Adam',
metrics=['accuracy'])

enter image description here

这个方法比以前的更糟糕

正如你所看到的,它在某个时期后没有学习,即使我正在获取所有数据而不是其中的一部分,这也会发生

在这不起作用之后,我还使用了dropout并尝试添加更多层,但这里没有任何效果

现在我的问题是,我在这里做错的是层错误还是数据错误我该如何改进?

最佳答案

澄清一下 - 这是一个回归问题,因此使用准确度实际上没有意义,因为您永远无法预测 0.23124 的确切值。

首先,您肯定希望在将您的值(不是热编码的值)传递到网络之前对其进行规范化。尝试使用 StandardScaler作为开始。

其次,我建议更改输出层中的激活函数 - 尝试使用 linear 作为损失 mean_squared_error 应该没问题。

为了验证您的模型“准确性” 将预测值与实际值一起绘制 - 这应该让您有机会直观地验证结果。然而,话虽如此,你的损失看起来已经很不错了。

检查 this post ,应该让您很好地掌握什么(激活和损失函数)以及何时使用。

关于python - Keras MLP 分类器不学习,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56523793/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com