gpt4 book ai didi

r - 使用插入符号库修剪树返回复杂的树

转载 作者:行者123 更新时间:2023-11-30 09:29:43 25 4
gpt4 key购买 nike

我正在将插入符号包用于树模型。我了解到插入符使用 CV 来找到修剪树的最佳调整参数。

这是我使用的代码:

id2 <- sample(1:nrow(data),2/3*nrow(data))
#learn
app <- data[id2,]
#test
test <- data[-id2,]

ctrl<-trainControl(method="cv", number=8,classProbs=TRUE, summaryFunction=twoClassSummary)
mod0 <- train(class~., data=app,method="rpart",trControl=ctrl,metric="ROC")
plot(mod0)
plot(mod0$finalModel,uniform=TRUE,margin=.1);text(mod0$finalModel,cex=0.8)

这是我的数据:https://drive.google.com/open?id=1xrCXTLqKvGiGeo2X0Y1DvoSKvzbYFnyccLimceDIbZg

但是每次我运行代码时,我都会得到不同复杂度的树(因为 CV?),并且树并没有真正被修剪,而是非常复杂并且有很多终端节点。

如何获得不太复杂的树?

最佳答案

您需要在调用train之前设置种子以获得可重现的结果。另外,如果您并行运行,请在 trainControl 中设置 seeds 选项。

至于“复杂树”......这是相当主观的。为什么您期望它们更加简单?

trainrpart 结果之间的一个区别是,后者使用“one SE”方法进行剪枝,而 train 剪枝为具有最佳性能的深度。您也可以将“one SE”方法与 train 结合使用(请参阅包网站),但我总是发现它往往比较保守(这是最初的观点)。

最大

关于r - 使用插入符号库修剪树返回复杂的树,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31702176/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com