r - 运行mlr包中的predict()函数时出错-6ren

r - 运行mlr包中的predict()函数时出错

转载作者：行者123 更新时间：2023-12-01 19:31:48

26

4

我正在尝试使用 mlr 包运行模型，但在使用 predict() 函数时遇到一些问题。它给我以下错误消息:

Error in predict(mod, task = task, subset = test) : 
Assertion on 'subset' failed: Must be of type 'integerish', not 'data.frame'

请在下面找到一个可重现的示例:

require(mlr)     # models
require(caTools) # sampling
require(Zelig)   # data

data("voteincome")
voteincome$vote <- as.factor(voteincome$vote)

set.seed(0)
sample <- sample.split(voteincome, SplitRatio = .75)
train <- subset(voteincome, sample == TRUE)
test <- subset(voteincome, sample == FALSE)

train <- na.omit(train)
test <- na.omit(test)

task <- makeClassifTask(data = train, target = "vote")
lrnr <- makeLearner("classif.randomForest")
mod <- train(lrnr, task)
pred <- predict(mod, task = task, subset = test)

然后出现错误。难道我做错了什么？谢谢!

最佳答案

mlr 期望将索引向量传递给subset 参数。然后它会自动对数据框进行子集化，因此您不必自己执行此操作。您还可以使用 mlr 通过重采样描述自动划分训练集和测试集(请参阅 the tutorial ):

require(mlr)     # models
require(caTools) # sampling
require(Zelig)   # data

data("voteincome")
voteincome$vote <- as.factor(voteincome$vote)

set.seed(0)
task <- makeClassifTask(data = voteincome, target = "vote")
lrnr <- makeLearner("classif.randomForest")
rdesc <- makeResampleDesc("Holdout", split = 0.75)

res <- resample(learner = lrnr, task = task, resampling = rdesc)

# get predictions on test set
getPredictionResponse(res$pred)

# compute accuracy, also see https://mlr-org.github.io/mlr-tutorial/devel/html/performance/index.html
performance(res$pred, acc)

关于r - 运行mlr包中的predict()函数时出错，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34378914/

26

4

0

文章推荐： c++ - 为什么我的递归函数按降序打印，然后按升序打印？

文章推荐： go - `%fs:0xfffffffffffffff8` 的真实地址是什么？

文章推荐： ios - Storyboard堆栈 View 未连接到 View 文件(Swift)

文章推荐： sql - 添加前检查扩展属性描述是否已存在

r - MLR:如何围绕学习器选择指定特征？
我想比较简单的逻辑回归模型，其中每个模型仅考虑一组指定的特征。我想在数据重新采样时对这些回归模型进行比较。 R 包 mlr 允许我使用 dropFeatures 在任务级别选择列。代码类似于: ful
r - MLR:如何围绕学习器选择指定特征？
我想比较简单的逻辑回归模型，其中每个模型仅考虑一组指定的特征。我想在数据重新采样时对这些回归模型进行比较。 R 包 mlr 允许我使用 dropFeatures 在任务级别选择列。代码类似于: ful
r - mlr - 集成模型
mlr 包很棒，创建 ModelMultiplexer 的想法也有帮助。但是 ModelMultiplexer 从所使用的模型中“选择”1 个模型。是否有任何支持或计划支持创建单个模型的 Bagge
r - mlr:为什么使用并行化时超参数调优的再现性会失败？
我在 mlr cheatsheet 中使用基于快速入门示例的代码。我添加了并行化并尝试多次调整参数。问题:为什么即使我每次在调优前都设置了set.seed()，重现性还是会失败(为什么结果不一样)？
r - 从基准实验中使用的重采样获取ResamplingIndices - mlr
我在基准实验中使用嵌套交叉验证。我想检索用于每个外循环的实例的索引。我知道有一个函数 getResamplingIndices() 适合此任务。但它不接受“BenchmarkResult”对象。有办法
r - 基准实验中使用的学习器的特征重要性 - MLR
我正在 R 中使用 mlr 包来比较二元分类任务中的两个学习器，即随机森林和套索分类器。我使用嵌套交叉验证来计算性能。然后，我想计算特征对于最佳分类器(本例中的随机森林)的重要性。为了实现这一目标，我
r - 在 mlr 中调整整数向量
我正在创建自定义学习器，特别是我正在尝试使用 h2o mlr 框架内的机器学习算法。 h2o.deeplearning 函数的“隐藏”参数是一个我想要调整的整数向量。我通过以下方式定义了“隐藏”参数:
MLR:未找到功能 "predict.WrappedModel"
我正在使用 R 3.6.1、RStudio 1.2.5019 和 mlr 2.15.0。已安装并加载 MLR。只加载 mlr 和构建 mlr 的包。现在，我已经使用 train 训练了一个模型。并希
r - 将下采样后的预测概率转换为分类中的实际概率(使用 mlr)
如果我在不平衡的二元目标变量的情况下使用欠采样来训练模型，则预测方法会在平衡数据集的假设下计算概率。如何将这些概率转换为不平衡数据的实际概率？转换参数/函数是在 mlr 包还是其他包中实现的？例如:
r - 如何使用 mlr 包预处理新数据以进行预测
如果我想使用 mlr 包对新数据进行预测，如何预处理新数据，以便使用原始数据预处理所需的信息。例如。如果我合并小因子水平并且新数据集中的频率与第一个数据集不同，则生成的因子水平可能不同并且无法进行预测
r - 使用 mlr 预测错误 :
我尝试使用以下代码训练 h2o 模型并对新数据进行预测，但这会导致错误。如何避免这个错误？ library(mlr) a <- data.frame(y=factor(c(1,1,1,1,1,1,1,
mlr - 包装器 normalizeFeatures 如何处理验证集？
我想知道函数 normalizeFeatures 如何与重采样策略一起工作。以下哪个说法是正确的？整个任务数据归一化训练数据被规范化，规范化的参数(比方说，经典标准化中的均值和标准差)用于规范化验
r - MLR - getBMRModels - 如何从基准测试结果访问每个模型
运行 Benchmark Experiment 时在多种算法上，通过调整包装器等。每种算法都会返回多个模型。提取每个单独的调整模型(具有各种超参数)的规范方法或有效方法是什么，以便可以单独访问它们，
r - MLR - 使用嵌套重采样的基准实验。如何获取内部重采样调整结果？
我正在一项任务中使用基准实验。我正在使用嵌套重采样策略( https://mlr-org.github.io/mlr-tutorial/devel/html/nested_resampling/ind
r - 使用 mlr 预测计数
我正在使用学习器 regr.gbm 来预测计数。在 mlr 之外，直接使用 gbm 包，我使用 distribution = "poisson" 和 predict.gbm，使用 type = "re
R mlr 包 - 是否可以保存参数调整中的所有模型？
我想问是否可以保存在参数调整过程中创建的所有模型，例如使用 tuneParams 函数。我想保存每个超参数集的每次交叉验证的模型。我可以看到 resample 和 benchmark 函数都有 mo
java - vlcj mlr 特殊字符
我关注这个伟大的网站已经很久了。今天，当我遇到一个问题时，我终于决定创建一个帐户。我的问题是相当基本的 vlcj 执行。我有一个程序作为音频播放器运行。除了一个我似乎无法弄清楚的问题外，一切都已完成
mlr3 - mlr pipeops 中的调试/检查步骤
我想检查计算中的中间步骤，但我不知道该怎么做。书中的例子: mutate = mlr_pipeops$get("mutate") filter = mlr_pipeops$get("filter",
r - 使用 mlr-package 构建模型时的自定义性能测量
我刚刚从 caret 切换过来至mlr对于我目前正在研究的一个具体问题。我想知道这里是否有人熟悉在 resample() 中指定自定义性能度量功能。这是一个可重现的代码示例: library(mlr
r - 列出 MLR 中的学习者，包括未安装的学习者
我想获取 mlr 包中集成的所有聚类算法的列表。我预计此代码会返回它们，但它排除了已卸载的代码: library(mlr) listLearners("cluster") # default: cre

首页

博学

6Ren·AI

商城

r - 运行mlr包中的predict()函数时出错