gpt4 book ai didi

machine-learning - 二元机器学习分类的置信概率

转载 作者:行者123 更新时间:2023-11-30 08:49:53 24 4
gpt4 key购买 nike

当使用 SKlearn 并使用 Predict_proba(x) 函数获取二元分类 [1, 0] 的概率时,该函数返回分类属于每个类别的概率。示例[.8,.34]。

社区是否采用标准方法将其降低为考虑所有因素的单一分类置信度?

选项 1)只需取预测分类的概率(本例中为 0.8)

选项 2)一些数学公式或函数调用,它考虑所有不同的概率并返回一个数字。这种置信度方法可以考虑谁接近不同类别的概率,并且如果不同类别之间没有太大分离,则返回较低的置信度。

最佳答案

没有这样做的标准。但你可以做的是改变阈值。我的确切意思是,如果您使用 predict 相反,它会抛出一个二进制文件来对数据集进行分类,它的作用是将 0.5 作为预测的阈值。就像如果分类为 1 的概率 >0.5,则将其分类为 1,如果 <=0.5,则将其分类为 0。但在某些情况下,这可能会导致糟糕的 f1 分数。

因此,方法应该是改变阈值,然后选择一个能产生最大 f1 分数或您想要用作分数函数的任何其他指标的阈值。 ROC(Receiver operating characteristic)曲线仅用于此目的。事实上,sklearn 给出类概率的动机只是为了让选择最佳阈值。

一个非常好的例子是预测患者是否患有癌症。所以你必须明智地选择你的阈值,如果你选择高,你可能会得到很多假阴性,如果你选择低,你可能会得到很多假阳性。所以你只需根据你的需要选择阈值(因为误报越多越好)。

希望对你有帮助!

关于machine-learning - 二元机器学习分类的置信概率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38552979/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com