r - 如何更改二元分类的阈值-6ren

r - 如何更改二元分类的阈值

转载作者：行者123 更新时间：2023-11-30 08:38:45

25

4

我在 R 中训练了一个 GBM 模型。由于我试图预测一个非常罕见的情况，所以我得到了很多误报。我想将阳性(“良好”)情况的阈值从默认值更改为 0.7。这是到目前为止我的代码。

modFit.glm.ml <- train(as.factor(ml.training$one_lease)~., data=ml.training, method = "glm")
confusionMatrix(ml.testing$one_lease, predict(modFit.glm.ml, ml.testing), positive = "Good")

此代码可以工作，但它使用默认截止值。有人提到这可以通过预测函数实现，但我不知道该怎么做。

最佳答案

您尚未提供可重现的示例，因此这是一个使用虹膜数据集来预测虹膜是否属于 setosa 类型的示例:

dat <- iris
dat$positive <- as.factor(ifelse(dat$Species == "setosa", "s", "ns"))
library(caret)
mod <- train(positive~Sepal.Length, data=dat, method="glm")

要使用 0.5 以外的预测概率的截止值生成混淆矩阵，您可以使用您想要的任何截止值对 predict 函数返回的概率进行阈值处理:

confusionMatrix(table(predict(mod, type="prob")[,"s"] >= 0.25,
                      dat$positive == "s"))
# Confusion Matrix and Statistics
# 
#        
#         FALSE TRUE
#   FALSE    88    3
#   TRUE     12   47
#                                           
#                Accuracy : 0.9             
#                  95% CI : (0.8404, 0.9429)
#     No Information Rate : 0.6667          
#     P-Value [Acc > NIR] : 2.439e-11       
#                                           
#                   Kappa : 0.7847          
#  Mcnemar's Test P-Value : 0.03887         
#                                           
#             Sensitivity : 0.8800          
#             Specificity : 0.9400          
#          Pos Pred Value : 0.9670          
#          Neg Pred Value : 0.7966          
#              Prevalence : 0.6667          
#          Detection Rate : 0.5867          
#    Detection Prevalence : 0.6067          
#       Balanced Accuracy : 0.9100          
#                                           
#        'Positive' Class : FALSE

关于r - 如何更改二元分类的阈值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32128879/

25

4

0

文章推荐： java - encog java 导出网络权重

文章推荐： javascript - Jquery 删除下一个 div 元素

文章推荐： javascript - 根据数据属性值获取中的输入元素

r - 将长向量中的元素剪裁到 +/- 阈值
我正在用 R 编写程序。我卡在这里。我有像这样的矢量 X=c(84.05, 108.04, 13.95, -194.05, 64.03, 208.05, 84.13, 57.04) 我想在用 180
Android ACTION_MOVE 阈值
我正在编写一个应用程序，该应用程序涉及使用手指或手写笔在屏幕上书写。我有那部分工作。在 ACTION_DOWN 上，开始绘制；在 ACTION_MOVE 上，添加线段；在 ACTION_UP 上，完成
python - 如何在opencv(阈值)中改变轮廓形成的区域
我正在尝试构建 OCR 以从图像中提取文本，我正在使用轮廓来形成文本字符的边界，经过几次更改 cv2.threshold 的试验后，我在形成文本字符的边界时得到了最适合的轮廓。 #files = o
c++ - 带掩码的 OpenCV 阈值
我正在尝试使用 OpenCV 的 cv::threshold函数(更具体 THRESH_OTSU )，只是我想用蒙版(任何形状)来做，以便在计算过程中忽略外部(背景)。图像是单 channel (必
python - 适应不同闪电条件的 OpenCV 阈值
对于学校项目，我试图用 Python 编写一个程序来跟踪学生的运动。为了做到这一点，我正在使用 OpenCV。在互联网上查找了一些教程后，我注意到几乎每个人都使用阈值来实现这一点，因为几乎每一步都需
jestjs - 测试报告为缓慢的开 Jest 阈值
我使用 jest 来驱动 selenium 测试，它报告一个需要 12 秒的测试缓慢(持续时间以红色突出显示)。在这种情况下，12 秒就可以了。如何将阈值配置为 30 秒？最佳答案 Jest is
python - 基于特定距离(阈值)的两个列表的交集
我想找到 list1 中与 list2 中的值足够接近的值(基于指定的阈值)，即与下面的代码类似的功能。然而，与 pyhton 的 set 交集相比，下面的 intersect_with_thresh
具有多个系列的 Jquery flot 阈值
我正在尝试创建一张图表上有两个系列并带有阈值选项的浮线图。我知道当我只有 1 个系列时如何启用阈值(就像这里 http://people.iola.dk/olau/flot/examples/thre
javascript - 获取计算的直方图 bin 阈值
我已正确应用 d3 (v 4.0) 直方图函数对数据数组进行分箱。我的代码如下所示: var bins = d3.histogram() .domain([data_points_min,
Mysql 全文 50% 阈值
我正在使用带有自然语言全文的 Mysql FULLTEXT 搜索，不幸的是，我遇到了 FULLTEXT 50% 阈值，如果给定的关键字出现在总行数的 50% 时间，则不允许我搜索行。我搜索并找到了一
Javascript math.round 阈值
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 8 年前。 Improve th
动态数据值的 JavaScript float 阈值
这是我的绘图数据 var data = [{ data: [[4, 80], [8, 50], [9, 130]], color: "r
opencv - 什么是 Canny 阈值？
是否可以制作Canny忽略短边还是忽略低梯度边？在我的例子中，我将卡片放在木头上，并在 canny 之后看到木结构的许多边缘 canny 函数中的两个阈值有什么用？最佳答案 Large intens
c++ - 带掩码的 OpenCV 阈值
我正在尝试使用 OpenCV 的 cv::threshold 函数(更具体的 THRESH_OTSU)，只是我想使用掩码(任何形状) ), 以便在计算过程中忽略外部(背景)。图像是单 channel
audio - 根据音频(阈值、频率)缩放图像
我正在寻找根据提供的音频、频率范围(例如 20hz-1000hz)和阈值缩放 PNG 文件，以获得平滑的效果。例如，当有脚踢时，比例平滑到 120%，我想让那些音频可视化器，如 dubstep 等.
scala - Spark mllib f1score 阈值
我正在尝试找到最佳阈值，以使我的逻辑回归具有最高的 f1 分数。但是，当我写下以下几行时: val f1Score = metrics.fMeasureByThreshold f1Score.fore
javascript - x 轴上的 float 阈值
我使用 Flot 创建了一个实时(每 10 毫秒更新一次)垂直样条图。图表可见here on Codepen 。我包括了 Flot multiple threshold plugin ，但我希望阈值使
python - Pandas dataframe 阈值——如果超过则保持数字固定
我有一个数据框，其中包含从第 1 天到第 7 天的三个人(John、Terry、Henry)的分数。 1 2 3 4 5 6 7
opencv - 多级 (4) Otsu 阈值
我正在尝试实现多级 Otsu 阈值，更具体地说，我需要 3 个阈值/4 个类。我知道关于 SO 的 2 个类似问题:#34856019 和 #22706742。问题是我没有得到好的结果:我已经阅读了
python - opencv 阈值 THRESH_BINARY 对彩色图像有何作用？
The documentation在 THRESH_BINARY 上说: dst(x,y) = maxval if src(x,y) > thresh else 0 这对我来说并不意味着这不适用于彩色

首页

博学

6Ren·AI

商城

r - 如何更改二元分类的阈值