python - 随机森林中的 class_weight 超参数改变混淆矩阵中的样本量-6ren

python - 随机森林中的 class_weight 超参数改变混淆矩阵中的样本量

转载作者：行者123 更新时间：2023-11-30 09:49:53

28

4

我目前正在研究一个随机森林分类模型，其中包含 24,000 个样本，其中 20,000 个样本属于 class 0其中 4,000 个属于 class 1 。我做了一个train_test_split其中 test_set 是 0.2整个数据集( test_set 中大约有 4,800 个样本)。由于我正在处理不平衡的数据，因此我查看了超参数 class_weight旨在解决这个问题。

我设置class_weight='balanced'时遇到的问题看看confusion_matrix我得到的训练集是这样的:

array([[13209, 747], [ 2776, 2468]])

正如你所看到的，下面的数组对应于 False Negative = 2776接下来是 True Positive = 2468 ，而上面的数组对应于 True Negative = 13209接下来是 False Positive = 747 。问题是样本量属于 class 1根据confusion_matrix是 2,776 (False Negative) + 2,468 (True Positive)总计为 5,244 samples属于class 1 。这没有任何意义，因为整个数据集仅包含属于 class 1 的 4,000 个样本。其中只有 3,200 个位于 train_set 中。它看起来像 confusion_matrix返回 Transposed矩阵的版本，因为实际样本量属于class 1在 training_set train_set 中应总计有 3,200 个样本和 test_set 中的 800 。一般来说，正确的数字应该是 747 + 2468，总计为 3,215，即属于 class 1 的正确样本数量。。有人可以解释一下我使用 class_weight 时会发生什么吗？？ confusion_matrix是真的吗？返回 transposed矩阵的版本？我是否以错误的方式看待它？我尝试寻找答案并访问了几个有些相似的问题，但没有一个真正涵盖了这个问题。

这些是我查看的一些来源:

scikit-learn: Random forest class_weight and sample_weight parameters

How to tune parameters in Random Forest, using Scikit Learn?

https://datascience.stackexchange.com/questions/11564/how-does-class-weights-work-in-randomforestclassifier

https://stats.stackexchange.com/questions/244630/difference-between-sample-weight-and-class-weight-randomforest-classifier

using sample_weight and class_weight in imbalanced dataset with RandomForest Classifier

如有任何帮助，我们将不胜感激，谢谢。

最佳答案

复制 docs 中的玩具示例:

from sklearn.metrics import confusion_matrix

y_true = [0, 1, 0, 1]
y_pred = [1, 1, 1, 0]

tn, fp, fn, tp = confusion_matrix(y_true, y_pred).ravel()
(tn, fp, fn, tp)
# (0, 2, 1, 1)

因此，您提供的混淆矩阵的读数似乎是正确的。

Is it true that the confusion_matrix returns a transposed version of the matrix?

正如上面的例子所示，没有。但是一个非常简单(而且看起来很无辜)的错误可能是您交换了 y_true 和 y_pred 参数的顺序，这确实很重要;结果确实是一个转置矩阵:

# correct order of arguments:
confusion_matrix(y_true, y_pred)
# array([[0, 2],
#        [1, 1]])

# inverted (wrong) order of the arguments:
confusion_matrix(y_pred, y_true)
# array([[0, 1],
#        [2, 1]])

从您提供的信息中无法判断这是否是原因，这很好地提醒了您为什么应该始终提供实际代码，而不是口头描述您的想法你的代码正在做...

关于python - 随机森林中的 class_weight 超参数改变混淆矩阵中的样本量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47079266/

28

4

0

文章推荐： java - 合并两个 Eclipse 插件

文章推荐： javascript - 使用回调 hell 将构建转换为 promise hell

文章推荐： java - Java 摄氏度到华氏度

文章推荐： javascript - 函数创建作为参数？

Julia 变量消失/改变
我有以下MWE function f(p) ans = zeros(p, 2) return ans end ans = f(2) ans b=ans.+1.0 ans 起初，ans是正确的，
OWIN 改变 UseStatic？
OWIN AppBuilder“UseStatic”位从本地文件系统传送文件，这在某些情况下很方便，但我希望它从我在应用程序启动时预先填充的内存中 IDictionary 传送内容。任何人都可以指出一
Javascript 改变 Typeof
我是 JavaScript 新手。我的代码允许我列出 JSON 文档的元素及其类型，并将所有元素连接到一个字符串 donnees_types 中。问题是 JavaScript 中的 typeof
javascript - 背景图像 - 改变
我想在每次刷新时更改主页上的背景图像。我怎样才能做到这一点？我认为 jquery 是可能的，但我不太清楚。感谢您对此主题的任何帮助或评论。最佳答案我不知道“如何”，但我找到了以下链接: http
java - for循环中的除数值正在神秘地(？)改变
所以我已经在这上面花了几个小时了，老实说我完全陷入困境。我写了一个 for 循环来计算整数中的数字数量，但我发现一旦我输入 10 位以上的数字，除数值就会发生变化，而且我不明白为什么。我在互联网上搜索
java - 改变 Activity
当我在使用表面 View 的游戏 Activity 和使用膨胀菜单的其他 Activity 之间切换时，我会收到错误消息。日志猫: 07-13 15:15:34.464: ERROR/Android
改变 RGB 颜色的亮度
听说很简单 R*=f; G*=f; B*=f; 其中 f 是标量值 0 .. 1.0 或更大改变亮度的方法不太正确颜色，但我找不到一些代码片段获得更好的东西(无需太多学习色彩理论)也许有人可以在这里给
java - 改变 ThreadPoolExecutor
如以下链接所述:- How to get the ThreadPoolExecutor to increase threads to max before queueing? 我将队列实现更改为在进入
javascript - 改变 slotMinutes
我只显示最初提供 20 分钟 slotMinutes 的日历。我试图让用户即时更改为 10 分钟的 slotMinutes。我有一个触发以下代码的按钮: $('#calendar').fullCal
ios - 改变 UIViewController
我的问题是:我的应用程序中有一个新闻列表(UITableView)当我点击 1 个"new"时，我打开它，里面有一个后退按钮，可以让我回到列表。现在的问题是我必须在滑动时实现"new"更改，所以我制作
postgresql - 改变 pg_config
我面临着与 I'm trying to install psycopg2 onto Mac OS 10.6.3; it claims it can't find "stdarg.h" but I ca
javascript - 改变。通过基于索引数组进行过滤来显示数组中的可见属性
需要通过为 array2 中不存在的索引设置 visible false 来从 array1 创建一个新的 array3。在下面的示例中，我有索引 0,2。所以对于 1,3，结果数组必须具有 vis
JavaScript 改变 this 的所有权
我有一个对象，类似这样 var Egg = function(){ this.test = $(.slider .label); $('.slider').slider({
swift - 改变 NSLayoutConstraint
我想改变 ScrollView 的宽度。首先，我这样做了: var scrollWidthConstraint: NSLayoutConstraint! 然后设置它: scrollWidthConst
javascript动画后不透明度有时会(随机)改变
我有两个动画，一个是“过渡”，它在悬停时缩小图像，另一个是 animation2，其中图像的不透明度以周期性间隔重复变化。我有 animation2 在图像上进行，当我将鼠标悬停在它上面时，anim
jQuery 改变 id!
我是一个 jQuery 新手，一直在尝试添加一个脚本来更改 div onClick 的 id。这是一个jsfiddle example . $(function accept() { $("
改变 C 中字母的大小写？
我正在尝试更改用户输入的字母的大小写，并将该字母的小写和大写版本存储在变量中。我已经编写了下面的代码，但它在运行时遇到了问题。有人指出是什么导致了问题吗？ #include #include #i
改变 char* 指向几位偏移量
假设我有这段代码: char num[2] = {15, 240}; char* p_num; 现在，如果我理解的一切正确，数组中的位应该像这样对齐: 00001111 11110000 我的问题是
JavaScript 改变 css
var html = '' + count + '' + i.Description + '' + i.Priority + '' + i.Status + 'johnsmith- ' + creat
改变 Minix3 的优先级队列
我在虚拟机上安装了 minix3，并希望我可以操纵当前的队列选择算法，以便我可以将其从优先级顺序更改为包括随机分类的低优先级作业的优先级顺序。我发现我需要更改的代码部分在 proc.c 中，具体部分是

首页

博学

6Ren·AI

商城

python - 随机森林中的 class_weight 超参数改变混淆矩阵中的样本量