gpt4 book ai didi

r - 如何使用 R 中的 caretEnsemble 包预测新数据集?

转载 作者:行者123 更新时间:2023-12-04 11:36:59 25 4
gpt4 key购买 nike

我目前在 R 中使用 caretEnsemble 包来组合在插入符号中训练的多个模型。我使用来自同一包的 caretList 函数获得了最终训练模型的列表(比如 model_list),如下所示。

    model_list <- caretList(
x = input_predictors,
y = input_labels,
metric = 'Accuracy',
tuneList = list(
randomForestModel = caretModelSpec(method='rf',
tuneLength=1,
preProcess=c('BoxCox', 'center', 'scale')),
ldaModel = caretModelSpec(method='lda',
tuneLength=1,
preProcess=c('BoxCox', 'center', 'scale')),
logisticRegressionModel = caretModelSpec(method='glm',
tuneLength=1,
preProcess=c('BoxCox', 'center', 'scale'))
),
trControl = myTrainControl
)

我提供的列车控制对象如下:

    myTrainControl = trainControl(method = "cv", 
number = 10,
index=createResample(training_input_data$retinopathy, 10),
savePredictions = TRUE,
classProbs = TRUE,
verboseIter = TRUE,
summaryFunction = twoClassSummary)

现在我正在训练这些模型列表:

ens <- caretEnsemble(model_list)

ens 上应用 summary 告诉我所选模型(model_list 之外),分配给这些所选模型的权重,out-of-为每个选定模型采样 AUC 值,最后为 ens 采样 AUC 值。

现在我想计算 ens 在其他测试数据上的性能(以了解样本外性能)。我将如何实现它?

我正在尝试:

ensPredictions <- predict(ens, newdata = test_data)

但它给我一个错误:

Error in `[.data.frame`(out, , obsLevels, drop = FALSE) : 
undefined columns selected

最佳答案

我首先要检查测试集是否具有训练集的所有特征。

关于r - 如何使用 R 中的 caretEnsemble 包预测新数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30522709/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com