gpt4 book ai didi

scikit-learn - 在 scikit-learn 中控制 LDA 和 QDA 的后验概率阈值

转载 作者:行者123 更新时间:2023-12-04 16:31:31 25 4
gpt4 key购买 nike

考虑以下用例(完全摘自 James 等人的《统计学习简介》)。

您正试图根据各种个人数据预测信用卡所有者是否会违约。您正在使用线性判别分析(或者,出于这个问题的目的,二次判别分析)。

您希望估算器优先考虑真阳性率而不是误报率。也就是说,正确识别即将发生的违约比预测不会发生的违约更为重要。

sklearn.lda.LDA 和/或 sklearn.qda.QDA 类中是否有此设置?我认为也许使用 class_prior 命名参数构建它们是合适的,但这似乎没有被接受。

最佳答案

您可以使用 lda.predict_proba 更改决策阈值,然后手动设置概率阈值:

lda = LDA().fit(X_train, y_train)
probs_positive_class = lda.predict_proba(X_test)[:, 1]
# say default is the positive class and we want to make few false positives
prediction = probs_positive_class > .9

这将为您提供关于他们是否会违约的非常保守的估计(如果有 90% 的把握,它只会说他们会违约)。.9 是否真的对应于 90% 确定取决于有多好 calibrated分类器是。

关于scikit-learn - 在 scikit-learn 中控制 LDA 和 QDA 的后验概率阈值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30092038/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com