gpt4 book ai didi

rpart 函数过度绘制或未实现所需的分区

转载 作者:行者123 更新时间:2023-11-30 09:50:57 24 4
gpt4 key购买 nike

  ID Ethnicity MaritalStatus EmploymentStatus type
1 10 5 3 1 3
2 24 1 2 2 1
3 30 1 1 3 4
4 35 2 2 2 3
5 40 5 1 3 4
6 57 1 2 4 1

这是我的示例数据。该表有近 94000 行。我尝试了以下命令

m1 <- rpart(type ~ Ethnicity, MaritalStatus, EmploymentStatus, 
data = table2, method = "anova")

我的目标是根据种族、婚姻状况和就业状况预测“类型”。所有变量都使用 as.factor() 转换为因子数据类型但分区是按 ID 进行的,而我希望按 Ethnicity 进行分区,然后按 MaritalStatusEmploymentStatus 进行分区。我尝试从数据框中删除 ID 列,但存在同样的问题。
我附上了我得到的结果的图像以及相应的 rpart.plot result
我的数据类型或任何基本的数据方法是否错误?
我是机器学习的初学者。我还尝试将 ID 的数据类型更改为数字。
有什么方法可以设置分区的层次结构吗?
为什么图形只是一条线?

overplotted rpart plot

最佳答案

您的公式中有错误。预测变量应使用 + 分隔,而不是 ,。在您的调用中,除了第一个预测变量(种族)之外的所有变量都将被忽略。

m1 <- rpart(type ~ Ethnicity + MaritalStatus + EmploymentStatus, 
data = table2, method = "anova")

关于rpart 函数过度绘制或未实现所需的分区,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45250172/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com