gpt4 book ai didi

machine-learning - h2o 流用户界面 : Build Model but no ROC CURVE or AUC for multiclass?

转载 作者:行者123 更新时间:2023-11-30 08:56:46 32 4
gpt4 key购买 nike

引用https://dzone.com/articles/machine-learning-with-h2o-hands-on-guide-for-data

我能够按照示例绘制 ROC 和 AUC 曲线,但是当我对数据执行相同操作时,我得到的是“评分历史记录 - 偏差”而不是“评分历史记录 - LOGLOSS”和我的“ROC 曲线 - TRAINING METRICS”没有出现。

我的数据集有 2 个类,0、1,而不是示例中的 yes 和 no。什么决定了ROC曲线是否具有可移植性?

更新了 2019 年 7 月 10 日对 Maurever 回复的引用:我的响应“标签”已“转换为枚举”,并将分布更改为“伯努利”,但我仍然无法绘制 ROC。 enter image description here

更新:对于与我有同样遭遇的 future 用户。即使您转换为枚举,h2o 似乎也无法使用类为“0”和“1”的响应。我的问题通过将 0 和 1 重新标记为“正常”和“恶意”来解决,并且将绘制 ROC 曲线。

最佳答案

My dataset has 2 classes, 0, 1 instead of yes and no from the example.

将会发生的情况是,H2O 决定这是一个数字列,而不是一个分类(也称为因子)列。修复方法很简单,就是在该列上使用 as.factor() 。在导入数据之后、使用数据构建模型之前执行此操作。

然后它就会知道构建分类模型,而不是回归模型,并且您将获得您期望看到的指标。

这是一个示例:https://stackoverflow.com/a/41441578/841830 (或者在 H2O 文档中搜索 as.factor,您会发现更多内容)

在 Flow 中,您首先上传文件,然后单击解析文件,它会显示列列表。分类/因子列在那里被称为“枚举”(是的,这很令人困惑)。您的列可能显示为数字,因此请转到下拉框并将其更改为枚举。然后开始解析。然后,构建您的模型。

关于machine-learning - h2o 流用户界面 : Build Model but no ROC CURVE or AUC for multiclass?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56930004/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com