gpt4 book ai didi

python - 解释多类逻辑回归中的预测概率

转载 作者:行者123 更新时间:2023-11-30 08:36:09 28 4
gpt4 key购买 nike

我有一个数据集,如下所示,其中 A、B、C、D、E 是特征,“T”是目标变量。

A     B    C     D     E       T
32 22 55 76 98 3
12 41 90 56 33 2
31 78 99 67 89 1
51 85 71 21 37 1
......
......

现在,我已经使用 Scikit Learn 应用多类逻辑回归分类器并获得预测值和概率矩阵:-

 A     B    C     D     E       T   Predicted    Probablity
32 22 55 76 98 3 3 0.35
12 41 90 56 33 2 1 0.68
31 78 99 67 89 1 3 0.31
51 85 71 21 37 1 1 0.25

现在只想问我如何解释结果概率,1)据我研究,Python默认给出事件的概率为1。那么如果是这种情况,0.35是否被认为是事件1的概率?或者2) 值 0.35 是第一种情况属于“3”类的可能性吗?我如何计算剩余两类的概率。像这样的东西:-

 A     B    C     D     E       T   Predicted     P_1    P_2    P_3
32 22 55 76 98 3 3 0.35 0.20 0.45
12 41 90 56 33 2 1 0.68 0.10 0.22
31 78 99 67 89 1 3 0.31 0.40 0.29
51 85 71 21 37 1 1 0.25 0.36 0.39

最佳答案

from sklearn.linear_classifier import LogisticRegression

lr = LogisticRegression(random_state = 1)
lr.fit(x_train,y_train)

我们拟合训练数据。

lr.predict_proba(x_test)

假设数据集包含三个类。输出将类似于:

array([[  2.69011925e-02,   5.40807755e-01,   4.32291053e-01],
[ 9.32525056e-01, 6.73606657e-02, 1.14278375e-04],
[ 5.24023874e-04, 3.24718067e-01, 6.74757909e-01],
[ 4.75066650e-02, 5.86482429e-01, 3.66010906e-01],
[ 1.83396339e-02, 4.77753541e-01, 5.03906825e-01],
[ 8.82971089e-01, 1.16720108e-01, 3.08803089e-04],
[ 4.64149328e-02, 7.17011933e-01, 2.36573134e-01],
[ 1.65574625e-02, 3.29502329e-01, 6.53940209e-01],
[ 8.70375470e-01, 1.29512862e-01, 1.11667567e-04],
[ 8.51328361e-01, 1.48584654e-01, 8.69851797e-05]])

在给定的输出数组中,每行有 3 列,显示每个类别各自的概率。每行代表一个样本。

lr.predict_proba(x_test[0,:]) **OR** lr.predict_proba(x_test)[0,:]

输出:

array([ 0.02690119,  0.54080775,  0.43229105])

即该样本的概率。

关于python - 解释多类逻辑回归中的预测概率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48459269/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com