python - sklearn 的 MLPClassifier 的 Predict_proba() 函数输出总可能性不等于 1-6ren

python - sklearn 的 MLPClassifier 的 Predict_proba() 函数输出总可能性不等于 1

转载作者：行者123 更新时间：2023-11-30 09:27:51

26

4

我使用 sklearn 的 MLPClassifier 构建了一个神经网络来预测赛马的结果。然而，有时，当我使用predict_proba()函数预测每匹马获胜的可能性时，我发现总可能性不等于1。有时，它可能是0.8xx或1.2xxx或1.1xxx等。最坏的情况可能是 2.5xx 或 0.3xxx 等。

无论我如何调整模型，在某些预测中仍然会发生这种情况。另外，我在将数据输入模型之前做了 MinMaxScaler。

rdx = rdx.fillna(value=-999) #-999 means missing data
x = np.array(rdx) #rdx is the feature of data 
y = np.array(rdy) #rdy is the label of data

# Scale Feature
scaler = MinMaxScaler()
scaler.fit(x)
x = scaler.transform(x)

# Build network
mlp =  MLPClassifier( activation='relu',alpha=1e-4,hidden_layer_sizes=(20,20), random_state=1,max_iter=1000,verbose=10,learning_rate_init=.1)
mlp.fit(x, y)

功能(rdx):

标签(rdy):

结果: 每个红色方框中，是每场比赛中所有马匹的可能性。但求和后不等于一。有时，它会更糟，例如 3.5 或 0.5 等。

2条数据记录:

我可以采取什么措施来防止这种情况发生？

最佳答案

我认为问题在于你构建标签的方式。您正在检查每匹马，这匹马获胜的概率是多少。这些总和不需要为 1。

看一下下面的例子: https://scikit-learn.org/stable/auto_examples/neural_networks/plot_mnist_filters.html#sphx-glr-auto-examples-neural-networks-plot-mnist-filters-py

y_train和y_test的形状分别为(60000,)和(40000,)。

但是，如果你将 y_train 和 y_test 更改为一个热编码向量(就像你在数据中一样)，然后在转换后的标签上训练一个新的 MLP 模型，那么你会发现你将得到的概率不会相加到 1。

我修改了上面链接中引用的示例以显示我想说的内容:

import matplotlib.pyplot as plt
from sklearn.datasets import fetch_openml
from sklearn.neural_network import MLPClassifier
from sklearn.preprocessing import OneHotEncoder

# Load data from https://www.openml.org/d/554
X, y = fetch_openml('mnist_784', version=1, return_X_y=True)
X = X / 255.

# rescale the data, use the traditional train/test split
X_train, X_test = X[:60000], X[60000:]
y_train, y_test = y[:60000], y[60000:]

# mlp = MLPClassifier(hidden_layer_sizes=(100, 100), max_iter=400, alpha=1e-4,
#                     solver='sgd', verbose=10, tol=1e-4, random_state=1)
mlp = MLPClassifier(hidden_layer_sizes=(50,), max_iter=10, alpha=1e-4,
                    solver='sgd', verbose=None, tol=1e-4, random_state=1,
                    learning_rate_init=.1)

mlp.fit(X_train, y_train)

print(y_train.shape)
print(mlp.predict_proba(X_test[:10]).sum(axis=1))

enc = OneHotEncoder(handle_unknown='ignore')

enc.fit(y_train.reshape(-1, 1))

y_train_transformed = enc.transform(y_train.reshape(-1, 1)).toarray()
y_test_transformed = enc.transform(y_test.reshape(-1, 1)).toarray()

# mlp = MLPClassifier(hidden_layer_sizes=(100, 100), max_iter=400, alpha=1e-4,
#                     solver='sgd', verbose=10, tol=1e-4, random_state=1)
mlp_new = MLPClassifier(hidden_layer_sizes=(50,), max_iter=10, alpha=1e-4,
                    solver='sgd', verbose=None, tol=1e-4, random_state=1,
                    learning_rate_init=.1)

mlp_new.fit(X_train, y_train_transformed)

print(y_train_transformed.shape)
print(mlp_new.predict_proba(X_test[:10]).sum(axis=1))

关于python - sklearn 的 MLPClassifier 的 Predict_proba() 函数输出总可能性不等于 1，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59015351/

26

4

0

文章推荐： java - 在java中下载文件时进度条卡住

文章推荐： java - Jbehave - @beforeStories 不起作用

文章推荐： java - 四舍五入到小数点后 2 位

iphone - 单独的单元格样式——可能性
是否可以在表格 View 中提供单独的单元格样式？最佳答案是的，看看几乎所有的苹果应用程序。他们倾向于使用不同控件的表格进行设置。这就是表格单元格具有不同重用标识符的原因。这样您就可以将正确的类型
Javascript:函数作为参数，可能性
我想知道是否可以在 Javascript 中做这样的事情: one(plus(nine())); // returns 10 看起来是这样，但我不确定如何将 one() 的值传递给 plus() 函数
c++ - 规范化非常小的双数列表(可能性)
我正在编写一个算法，在给定模型的情况下，我计算数据集列表的可能性，然后需要对每个可能性进行归一化(概率)。所以像 [0.00043, 0.00004, 0.00321] 这样的东西可能会被转换成 [0
c# - 检测 WOL 可能性
我想检测是否可以进行局域网唤醒。在我的路由器(Tomato 固件)上有一个包含信息的表格 - 当显示设备“事件(在 ARP 中)”时 - 可以通过 WOL(离线 Linux 电脑)打开该设备。我想
java - 不止一种 IndexOf 可能性
我正在寻找一种方法来解析具有几个可能使用的不同终止字符的子字符串。我应该使用不同的方法还是有办法使用正则表达式来整理字符？我当前的代码使用: smallstring = bigstring.subs
Maven surefire suiteXmlFile 可能性
目前我有可能使用 surefire 插件在 maven 上运行多个测试，如下所示: mvn clean test -Dsurefire.suiteXmlFiles=test1.xml,test2.xm
hadoop - HDFS HA 可能性
最近，我成功地为 HDFS 和 YARN 启用了 HA。现在我有一个事件的和备用的名称节点，自动故障转移工作正常。我正在使用 Cloudera Manager 和 CDH 5。我有以下问题。例如，
j - J 中给定长度的所有 bool 可能性
我想要最简单的动词，它给出给定长度的所有 bool 列表的列表。例如 f=. NB. Insert magic here f 2 0 0 0 1 1 0 1 1 f 3 0 0 0
list - 遍历所有(行，列)可能性？
这将是一个井字游戏实现: data Row = A | B | C deriving (Show, Read, Eq, Ord, Enum, Bounded) data Column = X
javascript - Chrome 扩展 XSS 可能性
这是一个假设性的问题: 我想构建一个 Chrome 扩展程序，它会跟踪用户在该扩展程序处于事件状态的网页子集上的点击情况，并通过 AJAX 将数据作为 POST 或 GET 请求发送到我在某处运行的外
mysql - Entity Framework 和数据库不可知编程，可能性？
我们想使用 Entity Framework (.NET 4.0) 构建可以处理 Sql Server、MySQL 和 Oracle 的应用程序。也许 Sqlite 也是。通过配置文件中的一些设置应
iphone - iOS 上的 WiFi 可能性
是否可以在 iPhone 上通过指定网络的 SSID 来创建数据连接？是否可以从应用程序检查具有指定 SSID 的网络的信号/可用性？问候，斯腾最佳答案遗憾的是，如果不使用私有(private
C# Lambda 性能问题/可能性/指南
我正在使用各种 lambda 表达式语法测试性能差异。如果我有一个简单的方法: public IEnumerable GetItems(int point) { return this.ite
java - 向父类(super class)添加新方法和由此产生的问题 - 可能性？
Effective Java 第 2 版的第 16 条，支持组合优于继承说如下 “如果父类(super class)在后续版本中获得了一个新方法并且你运气不好给子类一个具有相同签名的方法和不同的返回
javascript - 如果具有许多 or 表达式的 if else if 函数不会循环遍历所有 or 可能性
已关闭。此问题需要 debugging details 。目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and the
c++ - 如何通过最大数量的 Tic Tac Toe 可能性？
我想知道 Tic Tac Toe 有多少种可能性，所以我在网上搜索并找到了一个数学定理，它表明 Tic Tac Toe 中有 255168 种可能的游戏。网站:http://www.se16.inf
c - 在 C 中使用 C++ 可能性
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 8 年前。 Improve this qu
java - 如何在单个值中表示 4 种 boolean 可能性
我想在单个值中存储 4 个 boolean 可能性。例如，我想要一个单一的值来判断一个人是否: IsSingle IsGraduate IsMale IsLookingForPartner 那么将它们
java - Wicket RepeatingView 刷新/重新渲染？可能性？ [列出缺少的项目]
我的 Wicket 口应用程序遇到了一些问题。问题出在一个名为 OverviewPage 的页面上，这里有一些面板，例如 ListPanel，其中有我的 RepeatingView。这个Repea
java - 可能性 : Web Application through Spring MVC/Webflow
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 7年前关闭。 Improve this questi

首页

博学

6Ren·AI

商城

python - sklearn 的 MLPClassifier 的 Predict_proba() 函数输出总可能性不等于 1