r - 如何在 r 中的 h2o.automl 排行榜中打印所有模型的可变重要性-6ren

r - 如何在 r 中的 h2o.automl 排行榜中打印所有模型的可变重要性

转载作者：行者123 更新时间：2023-12-04 01:47:09

25

4

我在 R 中使用 H2o 包的 automl() 函数进行回归。

假设我使用名称“aml”来构建模型。

aml <- h2o.automl(x=x, y=y, training_frame = train_set,
              max_models = 20, seed = 1,
              keep_cross_validation_predictions = TRUE)

automl() 的排行榜显示了表现最好的模型。我能够通过 h2o.varimp() 函数打印预测变量的重要性，并使用 h2o.varimp_plot() 函数绘制相同的图表，仅用于领导者模型(automl 给出的最佳模型功能)。

h2o.varimp(aml@leader)
h2o.varimp_plot(aml@leader)

有没有办法打印排行榜中所有模型的预测变量的变量重要性，并使用上述两个函数绘制图表？

最佳答案

Stacked Ensembles(通常是领导者模型)尚不支持变量重要性 (JIRA here)。然而，其余模型的变量重要性可以在排行榜中的模型 id 循环中检索。请参阅下面的 R 代码。

library(h2o)
h2o.init()

# Import a sample binary outcome train/test set into H2O
train <- h2o.importFile("https://s3.amazonaws.com/erin-data/higgs/higgs_train_10k.csv")

# Identify predictors and response
y <- "response"
x <- setdiff(names(train), y)

# For binary classification, response should be a factor
train[,y] <- as.factor(train[,y])

# Run AutoML for 10 models
aml <- h2o.automl(x = x, y = y,
                  training_frame = train,
                  max_models = 10,
                  seed = 1)

# View the AutoML Leaderboard
lb <- aml@leaderboard
print(lb, n = nrow(lb))

# Get model ids for all models in the AutoML Leaderboard
model_ids <- as.data.frame(lb$model_id)[,1]

# View variable importance for all the models (besides Stacked Ensemble)
for (model_id in model_ids) {
  print(model_id)
  m <- h2o.getModel(model_id)
  h2o.varimp(m)
  h2o.varimp_plot(m)
}

关于r - 如何在 r 中的 h2o.automl 排行榜中打印所有模型的可变重要性，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54852453/

25

4

0

文章推荐： reactjs - 使用 npm 安装 react 包

文章推荐： r - 从 R 笔记本访问 Azure Blob 存储

文章推荐： react 原生。创建滑动动画

文章推荐： bash - 使用 aria2c 并行下载多个文件

automl - google automl 会自动进行图像增强吗？
我正在使用自定义数据集使用 google 的 automl。数据集由我收集的图像组成。然而，手动标记图像需要一些时间，所以我想通过图像增强来扩大数据集，例如旋转和模糊。 automl 是否自动在屏幕后
google-cloud-automl - AutoML 视觉 : Error: ImportData stopped due to too many errors
我选择在 AutoML Vision UI 中创建数据集，如下所示: 我明白了:错误:ImportData 由于错误太多而停止。请注意，它告诉我我的 csv 文件中有错误，但没有告诉我错误是什么，那
python - 在 h2o AutoML 上检索 h2o AutoML 的交叉验证性能 (AUC) for holdout dataset
我正在使用默认交叉验证 (nfolds=5) 使用 h2o AutoML 训练二元分类模型。我需要获得每个保留折叠的 AUC 分数，以便计算可变性。这是我使用的代码: h2o.init() pros
google-cloud-automl - 将 mp4 上传到 Google Cloud AutoML 失败，因为它 'Failed to extract a thumbnail from the video'
我正在尝试使用 AutoML Video Classification UI 来训练 AutoML。我一直在为无数错误而苦苦挣扎……这是我的最新消息:“无法从视频中提取缩略图。” 可悲的是，mp4 有
Azure AutoML 下载指标
我想知道是否有办法在 Azure 中的 AutoML 中完成运行后下载模型的指标？例如，我想将生成的混淆矩阵与其他可用指标一起下载为 png 文件。最佳答案您可以使用AutoMLRun的 get_
Azure AutoML 下载指标
我想知道是否有办法在 Azure 中的 AutoML 中完成运行后下载模型的指标？例如，我想将生成的混淆矩阵与其他可用指标一起下载为 png 文件。最佳答案您可以使用AutoMLRun的 get_
python - 仅使用操作名称和服务帐户凭据访问使用 AutoML 批量预测创建的长时间运行的操作
我面临一个问题，我在 GCP AutoML 自然语言中创建批量预测操作。为了创建操作(也就是开始批量预测过程)，我使用了 google.cloud.automl 模块的 PredictionServi
r - 无法在 automl() 用例中加载未获胜的模型
我正在使用 automl功能代码片段如下所示 h2o.init() h2o_train = as.h2o(train) h2o_test = as.h2o(test) aml aml@leaderb
azure - Azure AutoML 实验中仍运行被阻止的算法
我一直在尝试运行 AutoML 预测实验，只允许运行一种算法 (FBProphet)，而不允许运行其他算法。我遇到的问题是，即使我指定了被阻止的算法，它们仍然在实验中运行，占用了不必要的运行时间。例如
azure - Azure AutoML 实验中仍运行被阻止的算法
我一直在尝试运行 AutoML 预测实验，只允许运行一种算法 (FBProphet)，而不允许运行其他算法。我遇到的问题是，即使我指定了被阻止的算法，它们仍然在实验中运行，占用了不必要的运行时间。例如
firebase - 如何在网络应用上使用 Google AutoML？
我有一个可供使用的 Google Cloud AutoML NL 模型。我希望将它与我的带有 Firebase 后端的网络应用程序相关联。以下是我要调用的代码。存在授权问题。我想了解如何授权应用程序以
python - AutoMl Edge 模型仅显示图像
所以我是机器学习新手，正在研究 automl，它在线显示预测要好得多，但问题是我需要离线解决方案，所以在训练模型并下载它后，我将模型部署在边缘 Tensorflow 上离线。我得到了一个标签txt文件
machine-learning - autoML 视觉缺少训练边界框
我正在尝试在 autoML 视觉中创建一个新的对象检测模型。我关注了this & this有关如何准备和格式化我的训练数据的指南。由于某种未知的原因，导入数据时缺少很多边界框。例如，具有 84 个边界
go - 编码文件以发送到 Google AutoML
我正在编写一个 golang 脚本来将图像发送到 Google AutoML API 的预测引擎。它接受大多数使用以下代码的文件，但某些 .jpeg 或 .jpeg 会返回错误 500，提示文件无效
python - 如何使用 Google AutoML 更改预测阈值？
在 google AutoML 中创建模型后，我们可以使用提供的 python 代码进行预测。这是代码: import sys from google.cloud import automl_v1be
r - 从 H2O AutoML 排行榜中提取模型
当我使用 autoML 在 R 中训练模型时，我可以通过以下方式查看模型的排行榜 automl_model@leaderboard 而且我可以通过以下方式访问最佳模型 automl_model@lea
r - 如何从 h2o automl 保存所有模型
我正在尝试保存全部来自 h2o.automl 的模型作为 h2o 的一部分包裹。目前我可以使用 h2o.saveModel(aml@leader, path = "/home/data/user"
r - 保持 h2o.automl 的交叉验证预测和折叠分配
我没有看到设置参数的选项 keep_cross_validation_predictions 和 keep_cross_validation_fold_assignment 为 h2o.automl(
azure - 在本地计算机上下载并使用 Azure AutoML 模型？
我使用 Azure AutoML 来构建和训练分类模型。但是，我希望能够下载模型并在本地计算机上运行它，而不是将模型部署到 Web 服务或实时端点。我尝试关注https://learn.micros
azure - 具有多个协变量特征的时间序列的 Azure AutoML 预测示例
我想使用 Azure AutoML 进行预测，其中一个时间序列有多个功能。有什么我可以复制的例子吗？我一直在调查:https://github.com/Azure/MachineLearningNo

首页

博学

6Ren·AI

商城

r - 如何在 r 中的 h2o.automl 排行榜中打印所有模型的可变重要性