machine-learning - 为什么我的神经网络序列模型从一开始就达到 0.9998 的精度？-6ren

machine-learning - 为什么我的神经网络序列模型从一开始就达到 0.9998 的精度？

转载作者：行者123 更新时间：2023-11-30 09:41:46

25

4

我正在为 Twitter 媒体帖子构建一个主题标签推荐模型，该模型以推文文本为输入，对其进行 300 维词嵌入，并将其分类为 198 个主题标签。当我运行我的模型时，我从一开始就获得了 0.9998 的准确度，以后也不会改变!我的模型有什么问题？

import numpy as np
import pickle
from keras.layers.normalization import BatchNormalization
from keras.models import Sequential, load_model
from keras.layers import Dense, Dropout, Activation,LSTM, Embedding
from keras.callbacks import ModelCheckpoint, ReduceLROnPlateau
from keras import regularizers, initializers
package="2018_pickle"
with open(path1,"rb") as f:
    maxLen,l_h2i,l_w2i=pickle.load(f)
with open(path2,"rb") as f:
    X_train,X_test,X_train_indices,X_test_indices=pickle.load(f)
with open(path3,"rb") as f:
    Y_train,Y_test,Y_train_oh,Y_test_oh=pickle.load(f)
with open(path4,"rb") as f:
    emd_matrix=pickle.load(f)


if __name__ == '__main__':
modelname="model_1"
train=False
vocab_size = len(emd_matrix)
emd_dim=emd_matrix.shape[1]
if train:
    model = Sequential()
    model.add(Embedding(vocab_size , emd_dim, weights=[emd_matrix]
                        ,input_length=maxLen,trainable=False))
    model.add(LSTM(256,return_sequences=True,activation="relu",
                   kernel_regularizer=regularizers.l2(0.01),
                   kernel_initializer=initializers.glorot_normal(seed=None)))
    model.add(LSTM(256,return_sequences=True,activation="relu",
                   kernel_regularizer=regularizers.l2(0.01),
                   kernel_initializer=initializers.glorot_normal(seed=None)))
    model.add(LSTM(256,return_sequences=False,activation="relu",
                   kernel_regularizer=regularizers.l2(0.01),
                   kernel_initializer=initializers.glorot_normal(seed=None)))
    model.add(Dense(198,activation='softmax'))
    model.compile(loss='binary_crossentropy', optimizer='adam',
                  metrics=['accuracy'])
    checkpoint = ModelCheckpoint(filepath, monitor="loss",
                                 verbose=1, save_best_only=True, mode='min')
    reduce_lr = ReduceLROnPlateau(monitor='val_loss', factor=0.5,
                                  patience=2, min_lr=0.000001)
    history=model.fit(X_train_indices, Y_train_oh, batch_size=2048,
                      epochs=5, validation_split=0.1, shuffle=True,
                      callbacks=[checkpoint, reduce_lr])


_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
embedding_10 (Embedding)     (None, 54, 300)           22592100  
_________________________________________________________________
lstm_18 (LSTM)               (None, 54, 256)           570368    
_________________________________________________________________
lstm_19 (LSTM)               (None, 54, 256)           525312    
_________________________________________________________________
lstm_20 (LSTM)               (None, 256)               525312    
_________________________________________________________________
dense_7 (Dense)              (None, 198)               50886     
=================================================================
Total params: 24,263,978
Trainable params: 1,671,878
Non-trainable params: 22,592,100
_________________________________________________________________

最佳答案

最有可能的是，这是由于在多分类问题中错误地使用了loss='binary_crossentropy'(有关更多详细信息，请参阅 Keras binary_crossentropy vs categorical_crossentropy performance?)。

您应该将模型编译更改为

model.compile(loss='categorical_crossentropy', optimizer='adam',
                  metrics=['accuracy'])

关于machine-learning - 为什么我的神经网络序列模型从一开始就达到 0.9998 的精度？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57792209/

25

4

0

文章推荐： python - scikit learn 的 train_test_split( ) 方法

文章推荐： python - split() 缺少 1 个必需的位置参数 : 'y'

文章推荐： python - Tensorflow 1.14+ 序列化子类 Keras 层？

文章推荐： python - “Booster”对象没有属性 'score' - 准确性

JavaScript 精度
关于这个话题已经说了很多，但是我找不到我的问题的确切答案。 JavaScript 无法准确表示 0.1 等小数，这是可以理解的。例如，由于乘法运算期间发生舍入误差，这是正确的: 0.1 * 3 ==
之字形打印 float 精度
在 zig 中，可以使用“{d}”以十进制表示法打印浮点值。这将自动以全精度打印该值。有没有办法指定位数？是针对每个值，还是作为某种全局设置？最佳答案这将限制小数点后的位数，四舍五入和零填充: f
减法时的 MATLAB 精度
我正在进行的项目需要高精度。减法时我遇到的问题在这里说明: >> 1-0.9999999999999999 ans = 1.1102e-16 >> 1-0.99999999999999999 ans
Fortran - 在运行时设置变量的种类/精度
是否可以使变量本身的精度成为将在运行时定义的变量？说，如果我尝试编译: SUBROUTINE FOO( VARIABLE, PRECISION_VALUE ) IMPLICI
sqlite - 纬度查询-精度
我正在查询 SQLite 数据库以获取纬度/经度详细信息。 SELECT * FROM tblMain where latitude > -33.866 and latitude 151.20
fortran - 使用下划线定义种类/精度
我一直使用下划线将整数定义为 Fortran 中的特定类型。下面是一段代码，用于演示 1_8 的含义，例如: program main implicit none integer(2)
python - 品脱有效数字，精度
我正在寻找一种方法来告诉 pint 要打印多少个有效数字。例如，当我输入以下内容时: import pint ureg = pint.UnitRegistry() print(3*ureg.m /9)
安卓 IMU 精度
我正在从事一个项目，目标是从山上追踪动物。在第一个实地考察季中，我们使用了 OpenTags 和经过校准的摄像头，虽然可以正常工作，但需要大量的处理/校准，而且至关重要的是，当系统出现问题时无法提供任
划分时的 Javascript 精度
在 JavaScript 中有没有一种方法可以确定一个数除以另一个数是否会得到整数？就像 18.4/0.002 给我们 9200，但是 18.4/0.1 给我们 183.99999999999997。
数学库的 Javascript 精度
我正在尝试使用 Big.js 在 javascript 中完成此计算 r = (a * b)/ sqrt( ( a*sin(θ) )^2 + ( b*cos(θ) )^2 ) 我也试过 math.js
ios - gl_FragCoord 精度
我有这个片段着色器代码，它在 iOS 模拟器(非视网膜)和 iPad2(非视网膜)之间显示不同: highp vec2 textCoord; textCoord.x = gl_Fr
c++ double /精度
这个问题在这里已经有了答案: C++ calculating more precise than double or long double (2 个答案) 关闭 6 年前。是否有任何浮点类型在小
java - 位运算符 - 精度
我似乎一直困惑的三个问题: 为什么代码是 x & ~077比这行代码 x & 0177700 更好。是因为精度损失较小吗？为什么此代码对于设置数字中的第 5 位不正确？ num = num + 0x
c - float 精度
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Precision of Floating Point 我正在尝试使用一些 float 来计算概率，但我的最
c - float 精度
由于微 Controller 的精度，我定义了一个包含两个 float 比率的符号，而不是直接写结果。 #define INTERVAL (0.01F/0.499F) 代替 #defi
c - c语言搜索算法执行时间(精度)
我试图比较这 3 种搜索算法，起初我使用 time.h 库但没有任何反应，输出始终是 0.00000 秒。现在我试图在循环中使用一些计数器。但我在这里也有问题, 任何人都可以帮我处理代码吗？这是我的
c - printf() 精度
char buf[10]; int counter, x = 0; snprintf (buf, sizeof buf , "%.100d%n", x, &counter); printf("Coun
matlab:评估向量时的错误/精度
我注意到在评估向量时对我来说是不可预测的行为。直接执行它与在循环中进行索引似乎是完全不同的。谁能帮我解决这个问题？我知道可能在它如何进行每个操作中都有解释，所以我需要一些关于如何查找它的键多谢指教提
安卓 GPS 精度
我想在我的应用程序中使用精确的 gps 定位。所以我遵循了一个简单的教程(LocationManager 的基本用法，明确要求 GPS 提供商，要求更新 0 ms，0 m)并创建了一个应用程序。我对更
c++ - float 精度
float 在 1.0f 和 0.0f 之间有多少位精度，这样每个值都可以唯一表示？例如，如果第一个小数 float 不能表示 0.13f，答案就是 float 只有一位精度。最佳答案 std::

首页

博学

6Ren·AI

商城

machine-learning - 为什么我的神经网络序列模型从一开始就达到 0.9998 的精度？