gpt4 book ai didi

r - 从插入符号模型收集折叠外预测

转载 作者:行者123 更新时间:2023-12-02 09:15:57 25 4
gpt4 key购买 nike

我想使用脱字符号模型的折叠预测来训练包含一些原始预测变量的第二阶段模型。我可以按如下方式收集折叠外预测:

#Load Data
set.seed(1)
library(caret)
library(mlbench)
data(BostonHousing)

#Build Model (see ?train)
rpartFit <- train(medv ~ . + rm:lstat, data = BostonHousing, method="rpart",
trControl=trainControl(method='cv', number=folds,
savePredictions=TRUE))

#Collect out-of-fold predictions
out_of_fold <- rpartFit$pred
bestCP <- rpartFit$bestTune[,'.cp']
out_of_fold <- out_of_fold[out_of_fold$.cp==bestCP,]

这很好,但它们的顺序错误:

> all.equal(out_of_fold$obs, BostonHousing$medv)
[1] "Mean relative difference: 0.4521906"

我知道 train 对象返回一个列表,其中包含用于训练每个折叠的索引:

> str(rpartFit$control$index)
List of 10
$ Fold01: int [1:457] 1 2 3 4 5 6 7 8 9 10 ...
$ Fold02: int [1:454] 2 3 4 8 10 11 12 13 14 15 ...
$ Fold03: int [1:457] 1 2 3 4 5 6 7 8 9 10 ...
$ Fold04: int [1:455] 1 2 3 5 6 7 8 9 10 11 ...
$ Fold05: int [1:455] 1 2 3 4 5 6 7 8 9 10 ...
$ Fold06: int [1:455] 1 2 3 4 5 6 7 8 9 10 ...
$ Fold07: int [1:457] 1 3 4 5 6 7 8 9 10 13 ...
$ Fold08: int [1:455] 1 2 4 5 6 7 9 11 12 14 ...
$ Fold09: int [1:455] 1 2 3 4 5 6 7 8 9 10 ...
$ Fold10: int [1:454] 1 2 3 4 5 6 7 8 9 10 ...

如何使用此信息将观察结果按照与原始 BostonHousing 数据集相同的顺序放入我的 out_of_fold 对象中?

最佳答案

我将在输出中添加另一列,指示下一个版本(可能是一个月后)中每个示例的原始行号。

最大

关于r - 从插入符号模型收集折叠外预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11267723/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com