gpt4 book ai didi

r - 将随机森林设置为分类

转载 作者:行者123 更新时间:2023-12-04 17:23:00 24 4
gpt4 key购买 nike

我正在尝试对某些类变量为二进制(1 或 0)的数据进行随机森林。这是我正在运行的代码:

forest.model <- randomForest(x = ticdata2000[,1:85], y = ticdata2000[,86], 
ntree=500,
mtry=9,
importance=TRUE,
norm.votes=TRUE,
na.action=na.roughfix,
replace=FALSE,
)

但是当森林走到尽头时,我收到以下错误:
Warning message:
In randomForest.default(x = ticdata2000[, 1:85], y = ticdata2000[, :
The response has five or fewer unique values. Are you sure you want to do regression?

答案当然是不。我不想做回归。我有一个只接受 2 个类的单个离散变量。当然,当我用这个模型运行预测时,我会得到连续的数字,当我想要一个零和一的列表时。有人可以告诉我我做错了什么才能使用回归而不是分类吗?

最佳答案

使用 as.factor 将您的响应列更改为一个因子(或只是 factor )。由于您将该变量存储为数字 0 和 1,R 正确地将其解释为数字变量。如果你想让 R 以不同的方式对待它,你必须告诉它。

y 下的文档中提到了这一点。争论:

A response vector. If a factor, classification is assumed, otherwise regression is assumed. If omitted, randomForest will run in unsupervised mode.

关于r - 将随机森林设置为分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17138722/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com