gpt4 book ai didi

r - 使用 rpart 构建具有分类变量的分类树

转载 作者:行者123 更新时间:2023-12-04 20:04:52 27 4
gpt4 key购买 nike

我有一个包含 14 个特征的数据集,其中很少有如下特征,其中性别和婚姻状况是分类变量。

height,sex,maritalStatus,age,edu,homeType

SEX
1. Male
2. Female

MARITAL STATUS
1. Married
2. Living together, not married
3. Divorced or separated
4. Widowed
5. Single, never married

现在我使用 R 中的 rpart 库来使用以下内容构建分类树
rfit = rpart(homeType ~., data = trainingData, method = "class", cp = 0.0001)

这给了我一个不考虑性别和婚姻状况作为因素的决策树。

我正在考虑为此使用 as.factor :
sex = as.factor(trainingData$sex)
ms = as.factor(trainingData$maritalStatus)

但我不确定如何将这些信息传递给 rpart。由于 rpart() 中的 data 参数采用“trainingData”数据框。它将始终采用此数据框中的值。
我对 R 并不陌生,希望有人对此提供帮助。

最佳答案

您可以对 trainingData 进行更改直接输入数据框,然后运行 ​​rpart() .

trainingData$sex = as.factor(trainingData$sex)
trainingData$maritalStatus = as.factor(trainingData$maritalStatus)
rfit = rpart(homeType ~., data = trainingData, method = "class", cp = 0.0001)

关于r - 使用 rpart 构建具有分类变量的分类树,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26924892/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com