python - keras:准确度为 98%，但神经网络始终预测相同。可能是什么原因？

转载作者：太空宇宙更新时间：2023-11-03 19:42:31

24

4

我们在训练深度学习模型来预测贷款评分(分为 0、1 或 3)时遇到以下问题。

步骤如下:

第1步:创建新列“评分”(输出)

conditions = [
(df2['Credit Score'] >= 0) & (df2['Credit Score'] < 1000),
(df2['Credit Score'] >= 1000) & (df2['Credit Score'] < 6000),
(df2['Credit Score'] >= 6000) & (df2['Credit Score'] <= 7000)]
choices = [0,1,2]
df2['Scoring'] = np.select(conditions, choices)

第2步:准备训练

array = df2.values
X = np.vstack((array[:,2:3].T, array[:,5:15].T)).T
Y = array[:,15:]
N = Y.shape[0]
T = np.zeros((N, np.max(Y)+1))
for i in range(N):
  T[i,Y[i]] = 1

x_train, x_test, y_train, y_test = train_test_split(X, T, test_size=0.2, random_state=42)

第 3 步:拓扑

model = Sequential()

model.add(Dense(80, input_shape=(11,), activation='tanh'))
model.add(Dropout(0.2))
model.add(Dense(80, activation='tanh'))
model.add(Dropout(0.1))
model.add(Dense(40, activation='relu'))
model.add(Dense(3, activation='softmax'))

epochs =200
learning_rate = 0.00001
decay_rate = learning_rate / epochs
momentum = 0.002
sgd = SGD(lr=learning_rate, momentum=momentum, decay=decay_rate, nesterov=False)
ad = Adamax(lr=learning_rate)

第 4 步:训练

 epochs = 200 
 batch_size = 16 

 history = model.fit(x_train, y_train, validation_data=(x_test, y_test), nb_epoch=epochs, 
 batch_size=batch_size,validation_split=0.1) 
 print ('fit done!')

指标

365/365 [================================] - 0s 60us/样本 - 损耗:0.0963 - acc: 0.9808测试集损失:0.096 准确度:0.981

accuracy

第5步:预测

text1 = [1358,1555,1,3,1741,8,0,1596,1518,0,0] #scoring 0 
text2 = [1454,1601,3,11,1763,10,0,685,1044,0,0] #scoring 1 
text3 = [1209,1437,3,11,199,18,1,761,1333,1,0] #scoring 2

tmp = np.vstack(text1).T
textA = tmp.reshape(1,-1)

tmp = np.vstack(text2).T
textB = tmp.reshape(1,-1)

tmp = np.vstack(text3).T
print(tmp)
textC = tmp.reshape(1,-1)

p = model.predict(textA)
t = p[0]
print(textA,np.argmax(t))


p = model.predict(textB)
t = p[0]
print(textB,np.argmax(t))

p = model.predict(textC)
t = p[0]
print(textC,np.argmax(t))

问题:预测中的输出始终相同!!!

[9.9205679e-01 3.8634153e-04 7.5568780e-03] [[1358 1555 1 3 1741 8 0 1596 1518 0 0]] 0 --- scoring 0

[0.9862417 0.00205712 0.01170125] [[1454 1601 3 11 1763 10 0 685 1044 0 0]] 0 --- scoring 0

[9.9251783e-01 2.5733517e-04 7.2247880e-03] [[1209 1437 3 11 199 18 1 761 1333 1 0]] 0 ---- scoring 0

这种行为的原因是什么？

提前致谢!

最佳答案

您的数据集极其不平衡。一个很好的看待它的方法是:如果总是预测 0 可以让你达到 98% 的准确率，那么说某个东西属于不同的类别是相当危险的(或者必须非常明显)。神经网络可能发现的使任何少数类别不同于多数类别 (0) 的每种模式都必须非常独特，因为即使重叠很小，不预测 0 的成本也太高。

考虑以下示例:您有一个包含两个类 A 和 B 的数据集，这两个类都遵循正态分布。 A 类的平均值为 1，标准差为 1，B 类的平均值为 3，标准差为 0.1。您有 1,000,000 个 0 类样本和 20,000 个 1 类样本，因此始终预测 A 的准确度为 98%。 B 类的所有样本都将位于 2.743 和 3.257 之间，置信度为 99%。在这些值之间，A 类预计有 29,300 个样本，因此预测 B 类任何观测值的成本是在 29,300 个 A 样本中出错，但预测 A 类所有内容的成本是仅在 20,000 个 B 样本中出错.

该示例的图形外观如下:

import numpy as np
import matplotlib.pyplot as plt

# Get A and B
A = np.random.normal(1, 1, 1000000)
B = np.random.normal(3, 0.1, 20000)

# Count the number of observations in A for each B
B.sort()
a = A[np.logical_and(A >= B.min(), A <= B.max())]
a = [(a<i).sum() for i in B]

# Plot results
plt.plot(B, np.arange(B.shape[0]), label='Class B')
plt.plot(B, a, label='Class A')
plt.ylabel('Count of samples')
plt.xlabel('Values')
plt.legend()
plt.show()

请参阅这篇有关平衡数据集的文章:https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html

关于python - keras:准确度为 98%，但神经网络始终预测相同。可能是什么原因？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60351164/

24

4

0

文章推荐： matlab - 在此图像中找到一个近乎圆形的明亮像素带

文章推荐： css - 为什么css中的选择器 '+'不适用于图片？

文章推荐： c# - UseExceptionHandler 与 UseStatusCodePagesWithRedirects

文章推荐： c# - 如何在代码隐藏中设置 WPF ApplicationCommands

vim 通过快捷方式直接访问路径文件，始终
当我使用路径文件上的快捷方式在文件之间移动时，似乎我不仅仅是在文件之间移动。我使用>转到一个文件，在该文件中我更改光标的位置并执行某些操作，然后按 gf noremap 关于vim 通过快捷方式直
verilog 始终、开始和结束评估
我正在尝试使用 Pong P. Chu 的书来学习 Verilog。我有一个关于如何评估和实现始终 block 的问题。作者代码中的风格让我感到困惑。在此示例中，他编写了一个具有两个输出寄存器“y1
Javascript xmlhttprequest 始终
我正在尝试制作一个聊天应用程序，因此我需要它始终接收服务器信息。因此，当请求完成时，在: http.onreadystatechange=function(){ 我再次调用该函数，因此: reques
verilog - Verilog 始终@* 敏感度列表中包含哪些内容？
当您在 always block 敏感度列表中使用通配符 @* 时，我对什么被视为输入有点困惑。例如，在下面的示例中，哪些信号被解释为导致 always block 被重新评估的输入？据我了解，cl
c++ - 硬件断点 EXCEPTION_SINGLE_STEP 始终
我有一个充当调试器的程序。我为线程设置了一个 hw bp，将 dr0 设置为我希望 bp 所在的地址，将 dr7 设置为 1，因为我希望 bp 在每次执行该地址时生成一个事件。它有效，但现在的问题是
bash - 如何以管理员身份运行 Git Bash(始终)
如何每次都以管理员身份在 Windows 上运行 git bash。操作系统 - Windows 10 家庭版 64 位最佳答案我在 Google 上找到了这个结果: 将 Git Bash 设置
C 套接字双栈 ss_family 始终 IPv6
使用 accept() 时或 getpeername() , sockaddr_storage总是有 ss_family=AF_INET6 : struct sockaddr_storage addr
javascript - Cordova:始终 deviceready 尚未触发
我在 Cordova 方面还有另一个问题。我想在 Cordova 7.1.0 中使用插件“cordova.custom.plugins.exitapp”和“cordova-plugins-printe
始终 block 中的 Veriloggenerate/genvar
我试图让模块通过 ISE 12.4 中的语法检查，但它给了我一个我不明白的错误。首先是代码片段: parameter ROWBITS = 4; reg [ROWBITS-1:0] temp; genv
ios - iOS cordova允许“始终”访问位置
我正在使用Cordova开发适用于iOS的应用程序，其中包括地理位置功能(我使用官方插件https://github.com/apache/cordova-plugin-geolocation)。我在
始终 block 的灵敏度列表中的 Verilog 多个信号变化
我想知道是否有可能只在敏感列表中的多个信号一起变化时才执行 always block 。例如，假设我有一个信号“in”和另一个“posedge clk”。我希望在两个信号都发生变化时执行 alway
java - 游标.getCount 始终 = 0
我需要实现一种算法来访问数据库来检查最后一个元素，以便计算新的元素。当然，第一次这是不可能的，因为数据库是空的，我得到 IndexOutOfBoundsException) index 0 reque
javascript - 使用 jQuery 具有相同高度的两个元素 - 始终
我正在利用我在网上找到的画廊系统，根据鼠标图像的接近程度，它会按比例增长。链接:Gallery 好吧，我调整了代码以响应(如您所见正在 build 中)并且没有明显的问题。我的问题在更改分辨率时开始
.net - 使 Windows 应用程序始终位于其他窗口之上并处于焦点位置 - 始终
我正在创建一个 kiosk 应用程序，我想确保它无论如何始终位于其他 Windows 应用程序和 Windows 任务栏之上。我已经阻止了 Windows 键盘命令(alt-tab 等)，但仍有可能
javascript - 容器组件是否应该*始终*连接到 Redux？
我即将开始一个新的 React 项目，并尝试利用我以前的知识来创建一些关于我如何构建应用程序的规则。有些事情我认为是真的: Redux 保存整个应用程序的“主要”数据如果需要跨应用程序共享，Red
visual-studio-code - 是否可以将集成终端*始终*放在右侧？
当你打开 VS Code 时，终端默认是在底部打开的。您可以单击该图标将其向右移动。我想知道是否有办法将右侧打开设置为默认值。谢谢。最佳答案是的 - 在 v1.20 中引入了设置 workb
python - 修改 `objects` 以*始终*返回对象的子集？
我有一个Events表，其中包含各种类型的事件。我只关心其中一种类型。因此，我编写的每个查询都以开头 Events.objects.filter(event_type="the_type").\
swift - 计时器未触发(timeInterval 始终 == 0.0)
我在单例中创建了一个Timer，并且我一直在努力解决为什么Timer没有触发。我查看了这里的帖子，但没有找到我认为可以直接回答我的问题的帖子。 class ConnectionStateMonitor
ios - prepareForSegue 传递索引 0 的值...始终
我在 TableViewController 中显示了一组项目。它们在 TVC 中正确显示。下面的代码会继续，但它只会继续到我的 MKMapItem 数组的 indexPath 0，而不是被单击的单元
ios - 应用内购买错误，始终 myProduct 为 0
我的 VC 是这样的: var coins = 50 // coins override func viewDidLoad() { super.viewDidLoad() if(SKP

首页

博学

6Ren·AI