python - 如何调整典型sk-learn数据挖掘方法的阈值以平衡精度和召回率？-6ren

python - 如何调整典型sk-learn数据挖掘方法的阈值以平衡精度和召回率？

转载作者：行者123 更新时间：2023-11-30 09:21:33

25

4

基本上，我使用 python sk-learn 库中的一些数据挖掘算法来进行分类。

但是，我得到了一些非常不平衡的结果，例如大约 0.99 召回率和低于 0.1 精确率。

从概念上讲，分类算法依赖于一些“阈值”来做出决定，这意味着我应该能够简单地通过调整这个“阈值”来平衡精度和召回率。

但是，我在 sklearn 中找不到一些 API 来帮助解决此问题，所以我的问题是:如何操纵 sklearn 库中的底层“阈值”来平衡准确率和召回率？

最佳答案

好吧，如果您的问题不是关于不平衡数据，我必须向您推荐我在 Andrew Ng 的机器学习类(class)中学到的一些笔记:http://www.holehouse.org/mlclass/06_Logistic_Regression.html

我在这里选择了逻辑回归，因为我真的不知道你正在使用的方法。但结论基本上是阈值不是学习者模型的显式参数。我的意思是，您可以选择之后在哪里进行分类(在概率模型中)，或者您可以在其他方法中建立一些加权参数(检查这个答案:scikit .predict() default threshold)。

此阈值仅考虑误报/漏报(精确度/召回率)的比例，不应严格视为学习算法的参数。

旁注:在一个特定的分类问题中，我“凭经验”发现我至少需要 0.6 的概率才能正确，因此我使用了分类器的方法 predict_proba 而不是 预测 所以是我最终决定了返回的类。不知道是否有帮助。

关于python - 如何调整典型sk-learn数据挖掘方法的阈值以平衡精度和召回率？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35438617/

25

4

0

文章推荐： r - 如何创建事件时间变量？

文章推荐： python - 如何使用 scipy 查找优化函数的参数？

文章推荐： r - 找到决策树中的最大值

文章推荐： java - byte[] 到没有空终止符的字符串

video - 确定视频文件的(典型？)关键帧频率
有什么方法可以使用常用工具(ffmpeg？mplayer/mencoder？mkvmerge？等)来查找关键帧在给定视频文件中出现的频率？ {从而找到最小搜索大小？}这似乎是一个显而易见的统计数据，“
c# - 典型 3 层业务层中的静态方法与实例方法
关闭。这个问题是opinion-based .它目前不接受答案。想要改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 关闭 2 年前。 Improve
linux - SSD的“典型”延迟意味着什么？
我正在阅读Intel的SSD产品specification。那里有一张桌子说 Latency (typical) read/write < 10 us 但是没有更多细节可以解释这个数字。有人知道“典型
linux - 典型 Linux 发行版中最旧的代码
出于好奇:典型的 Linux 发行版中最古老的代码/包是什么？电子书？海湾合作委员会？最佳答案 Sun RPC 很老了，它在 C 库中: http://blogs.oracle.com/webmin
language-agnostic - 典型 float 中无倒数的最小正整数是多少？
一个常见的假设是 1/x * x == 1。在符合 IEEE 754 标准的常见硬件上打破这个的最小正整数是多少？当乘法逆的假设失败时，写得不好的有理算术就会停止工作。由于包括 C 和 C++ 在内
android - 常见/典型 Android 设备上的触摸点数量
流行手机型号支持的典型触摸点数量是多少？我在基础研究中看到低至 2 和高至 5，但我希望能够将其映射到实际手机和更好的限制! 最佳答案两部手机的触控点数据: Galaxy S 5 LG
jQuery document.location 不适用于 IE(典型)
我讨厌讨厌IE!既然我已经咆哮了，我确实需要一些帮助。我这里有这个网站。 http://pearsonlyle.uwpistol.net/galleries/susie-theodorou/edito
c# - 典型 Windows 和 .NET 二进制文件之间的区别
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
典型 Web 应用程序中的 Node.js 可扩展性
作为来自企业 IT 的 Node.js 初学者，我无法理解 Node.js 用法的某一方面。我将我的问题分为两部分。问题 1) 严格从可扩展性的角度来看，I/O 密集型 Web 应用程序如何使用 N
webrtc - 典型 webrtc 用例的序列图(如文本、视频、音频)
我希望我的问题是合法的......我问这个问题是因为在阅读了许多博客，玩了许多示例应用程序和官方 API 1 周后，我仍然很困惑，从哪里开始编码...... 总的来说，就浏览器之间的系统架构而言 W
java - 典型 1 对 n 关系的 Stackoverflow 异常(递归)
这是我的汽车类(class): public class Car { private int FGNr; private String name; private String type; priva
excel - 典型 Excel 365 对象的 Microsoft 文档引用 "an object in the Applies To list"，但 "Applies to list"在哪里？
我认为我的问题标题清楚地表达了我需要的信息的本质。我用谷歌搜索了 where is the "applies to list" in vba excel以及其中的一些变体，都带有如图所示的引号，这应该

首页

博学

6Ren·AI

商城

python - 如何调整典型sk-learn数据挖掘方法的阈值以平衡精度和召回率？